客户采访

大规模牛基因组测序使牲畜快速改良成为可能

来自1000牛种族基因组项目的WGS数据是辅导积极和消极特征的发现,在全球范围内受益于畜群。

大规模牛基因组测序使牲畜快速改良成为可能

大规模牛基因组测序使牲畜快速改良成为可能

介绍

对牛个体进行全基因组测序(WGS)是使用当前基因组分析技术评估牛品种遗传变异的最佳方法。然而,对于大多数育种家和研究人员来说,这一选择仍然是财政负担不起的。因此,公牛、奶牛和小母牛的常规基因分型是使用成本较低的单核苷酸多态性(SNP)阵列进行的。单核苷酸多态性阵列旨在发现与积极的生产和健康特征相关的基因变异,或与疾病和其他消极特征相关的基因变异。

2012年,Ben Hayes,博士,那么农业维多利亚州1,成立了1000牛基因组计划2在牛遗传和促进国际合作的全球帮助理解。3.该项目的初始运行来自澳大利亚关键祖先公牛选择线的238个动物,10.5×平均基因组覆盖在Hiseq 3000系统上。该项目现在包括40个国际合作伙伴,2700个乳制品和牛肉动物,并确定了9000万遗传变异。世界各地的研究人员和育种者都受益于利用这种数据的发现,包括致死突变的鉴定4以及牛的最大规模序列水平全基因组关联研究(GWAS)。5汉斯德国特威勒,博士,高级研究员,拉筹伯大学和农业维多利亚墨尔本,澳大利亚,现在领导的1000牛基因组计划。他的研究小组正计划在未来一年内的另一个运行甚至包括更多的动物。

iCommunity与德国特威勒博士谈到,了解项目是如何走过来的,它的各种调查yobet亚洲结果,以及什么样的未来使用WGS的识别与其他物种的繁殖正面和负面的性状相关的变种成立。

Hans Daetwyler博士,澳大利亚墨尔本拉筹伯大学和维多利亚农业高级研究员。

问:什么是1000牛基因组项目?

HANS DAETWYLER(HD):最初由Ben Hayes博士提出的1000牛种族基因组项目,他是我在农业维多利亚州的老板。当时,对大量动物进行测序是昂贵的,并且这是防止在对新鲜和新品种的研究中的广泛使用。机构没有资金来排序足够的个人以使估算估算,其统计上患者在低密度SNP阵列数据中的不观察到的基因型。

1000熊基因组联盟背后的想法是比较牛的全基因组序列,包括Bos Taurus.BOS奖项, 和别的博斯种当我们发表第一篇论文时,1000头公牛基因组项目包括234头牛和全球5个合作机构。5从那时起,我们几乎每年都在新一轮分析。每次运行都增加了更多的动物,更多的伙伴机构加入项目。我们迄今为止测量了超过2700个动物。

问:1000牛基因组项目开始的时候,你的角色是什么?

高清:我对项目的前几年进行了数据分析。合作伙伴向我们发送了他们的全基因组序列,与参考基因组排列。我们分析了BAM文件,组合数据,并运行变体呼叫者以在数据集中识别SNP和Indels。我们为我们的合作伙伴提供了一个原始和过滤的SNP和项目中所有动物的相关基因型。我们今天继续这个过程。

当海斯博士于2016年迁至昆士兰州大学时,我接过担任1000牛种族基因组项目的指导委员会主席。

“如果农民在小牛出生时或很小的时候就有一个更准确的EBV,他们就可以自信地选择并使用这些个体进行繁殖,比其他方法早得多。它将奶牛的繁殖间隔从5-6年缩短到2年。”

问:研究人员使用哪些工具和方法用于识别因果变量?

高清:十年前,它们使用低密度SNP阵列来识别相关的遗传区域,并且可能已经进行了该区域的目标测序以识别其他变体。那时,测序是缓慢,昂贵的过程。研究人员将使用较旧的NGS技术进行靶向测序,然后仅在他们怀疑是定量性状基因座(QTL)的载体中的动物。他们没有参考基因组,因此他们对所涉及的基因数量并不是一个好主意。它们可能只使用该方法识别少数突变。

1000牛基因组计划数据库包括基于许多动物全基因组序列。它显著加快因果突变的发现过程,并改善牛群全球遗传增益。

问:为什么提高奶牛和肉牛的遗传增益率很重要?

高清:除了营养和健康管理之外,遗传变化是提高生产力和效率的主要成分,以及改善群体内的健康福利特质。遗传增益是累积的。随着时间的推移,它就像复合兴趣一样。每当您在遗传上做出积极的变化,有利于更好的性能或改善健康和福利,它仍然存在于群体中,并且积极效果复杂化。相当于农民努力的重要组成部分花费随着时间的推移提高他们畜群的生产力。

问:与先前的选择性育种方法相比,基因组选择有哪些好处?

高清:在基因组学之前,农民使用表型选择,这些选择,这些选择,这些选择,这些选择是根据其特征观察个体及其后代的育种。他们还将使用谱系选择,它使用关于近亲的信息。

基因组选择的力量是它将该信息与生产,效率和健康数据相结合,更远亲戚。基因组选择导致估计的育种值(EBV)的准确性增加,特别是对于年轻人。如果农民在出生时或在一个非常年轻的时期对小腿进行更准确的EBV,他们可以自信地选择并使用这些人比他们更早地繁殖。它缩短了5-6岁至2年的乳制品公牛生成间隔。

问:什么牛牧民百分比使用基因组选择,以提高他们的牧群?

高清:利用奶牛和肉牛养殖户之间的基因组选择不同的。与此相反,以表型选择,基因组选择允许使用不具有的女儿年轻的公牛。使用这些年轻的基因组测试的公牛已经在过去几年显着增加。在一些国家,速率超过所使用的总人工授精(AI)公牛的80%。在澳大利亚,使用基因组测试公牛的40%左右。在澳大利亚牛肉,它会在北美地区的主要肉牛是一个较低比例比奶制品,但同样颇有几分更高。

“该项目中的所有动物都是或将从加州大学戴维斯的农业研究服务中重新调整新参考基因组。我们希望为每个人都提供改进的数据。”

问:与Sanger测序相比,NGS测序祖先牛的价值是什么?

高清:只有当你拥有由NGS的全基因组序列组成的大量数据集时,才有可能搜索因果或近似因果突变。与桑格测序相比,NGS使我们能够以更低的价格对更多的动物进行测序。NGS提高了imputation的准确性和效率,我们可以推断只有SNP阵列基因型评估的个体的序列表型。这是最大的优势。

NGS的好处也影响功能基因组研究。RNA-Seq和染色质免疫沉淀(ChIP)-Seq结合NGS提供一组个体的功能信息。我们用这些信息来搜索近乎因果突变,然后直接进行基因型。对这些突变进行基因分型还直接提高了跨品种和与训练人群相关性较低的个体的预测准确性。

问:如何是关键祖先多头鉴定?

高清:有几种方法用于识别关键的祖先公牛。主要的方法是选择一个系谱,并确定哪些个体可以解释该系谱中的大多数遗传变异。较新的方法是利用该群体的基因型甚至单倍型来寻找多样性。关键祖先的选择是基于他们是否拥有最多的单倍型或在种群中所代表的单倍型集合的强补体。另一种方法是观察那些单倍型的个体,这些单倍型在个体序列中还没有被涵盖。

问:1000牛种族基因组数据库中列入的人数的总数是多少?

高清:我们超越了1000人的原始目标。在上次分析运行中,我们有超过2700人的人,我们即将开始新的1000公牛队。该项目中的所有动物已经或将是从加利福尼亚大学戴维斯的农业研究服务中重新调整新参考基因组。我们希望能够改进所有人的数据。

在1000牛种族基因组数据库中,牛肉团体群体略有更多的乳制品群体。该项目的主要品种组是荷斯坦,约20%。安格斯是下一个最大的群体,其次是棕色瑞士人。我们还在数据库中有双重牛,包括Simmental和Fleckvieh。最近,有很多Bos indicus捐款,包括来自澳大利亚的婆罗门。

问:1000公牛基因组研究小组已经确定了多少新的牛标记?

高清:在我们开始1000头公牛基因组项目之前,研究人员在分析中使用了多达60万个变种。在我们对240只动物进行的第一次试验中,我们确定了25只−2700万个SNP和INDEL用于金牛座独自的。我们现在约为4000万Bos Taurus.只有个体。当你包括Bos indicus牛,牦牛和其他亚种,它是大约8000万张过滤的变体。

“1000红牛基因组数据库已通过动物养殖较早使用WGS数据的加速牛研究的步伐。”

问:1000牛基因组数据库对研究人员的价值是多少?

高清:1000公牛募集基因组数据集对研究人员有价值,以两种方式对研究人员有价值。首先,研究人员可以使用它作为参考集,以赋予具有SNP阵列基因型的群体群体数据组中的全基因组序列。然后,它们可以执行强大的GWA,并调查利用WG的不同基因组选择方法。4

它还使研究人员能够寻找致病或致命的隐性疾病突变。使用1000牛种基因组数据集作为控制,研究人员可以使用过滤策略来缩小他们对小型基因组区域的搜索。

问:世界上任何地方的研究人员都可以使用这个数据库吗?

高清:1000公牛基因组数据库可供参与该项目并同意与该联盟共享其数据的研究机构使用。使用数据进行的研究类型几乎没有限制。然而,联合体中的研究人员不允许在其机构之外共享数据。例如,如果一名研究人员的合作者想要分析1000个公牛基因组数据,那么该合作者必须成为该项目的成员。

目前,我们在全球范围内的项目38家机构。1000牛基因组计划已经培养几个显著的合作。这是它的持久遗产之一。

问:使用1000牛基因组数据库进行了哪些发现?

高清:在1000个公牛基因组数据库中的WGS数据是有价值的,支持许多应用育种和研究研究。研究人员利用1000公牛基因组数据库来识别几种产奶性状的阳性变异。6还有几种使用该数据识别的因果突变。例如,我们的法国合作者发现了胚胎致命突变的因果突变,即使我们知道它们存在,即使我们已经存在。7

序列级GWA提高了我们对性状结构的理解,并支持功能研究。例如,WGS数据为QTL研究提供了插补功能。研究人员还利用WGS数据确定SNP集并对其进行优先排序,以改进基因组预测。8-11

“Hiseq系统提供高吞吐量,因此我们可以以低价格点执行WGS,RNA-SEQ和Chip-SEQ。数据质量很好,系统是我们的WGS工作人员。”

问:这些发现如何影响育种者?

高清:1000牛种族基因组数据库通过早期使用WGS数据在动物育种中加速了牛研究的速度。致命突变的发现对育种者产生了直接的积极影响。发现突变时,将它们立即加入到SNP阵列中以鉴定群中的载体。这些个体选择在AI过程中,这降低了群体内的致命突变的频率。

我们现在有SNP的更完整的清单,并插入缺失的变化在我们所有的人群,并能够设计出更好的SNP阵列。而不是依靠那些出现在一个频率的“足够好”来推断它们的因果随机单核苷酸多态性,我们可以用丰富的SNP阵列,我们知道是因果关系,并直接影响的性状。

问:哪些NGS系统用于执行WGS?

高清:我们使用两台HiSeq 3000系统进行测序,我们还有MiSeq和NextSeq 500系统。HiSeq系统提供高通量,因此我们可以以低价格执行WGS, RNA-Seq和ChIP-Seq。数据质量非常好,系统一直是我们WGS的主力。我们使用MiSeq系统的应用程序,我们需要稍微长一点的读取。

我们正在研究是否对我们HiSeq系统与NovaSeq 6000系统,这将使我们通过测序(GBS)一台仪器上进行大规模的WGS和基因分型升级。

问:被用于其他牲畜或植物物种产生的基因组测序的1000种数据库的1000牛基因组的方法呢?

高清:我们正在使用这种方法在类似的绵羊,羊肉组的项目中。12.我们已经测序了935张绵羊,从NCBI或EBI短读序列档案中下载了原始数据,并将其与新西兰新西兰和CSIRO等合作者一起处理过的合作者。我们执行了Variant调用,创建了使用基因,SNP和Indels的* .vcf文件,并在欧洲变体存档中发布了数据。13.

我认为这个概念也有植物的优点。我确信它已被使用拟南芥在一些主要作物中。然而,一些植物具有非常大的基因组。小麦基因组有170亿碱基对。使WGS更昂贵的执行并使数据进行命令。我们在小麦中进行了Exome测序,部分原因是较低的价格。相比之下,Canola具有12亿碱基对的短基因组。这使得执行WGS相对便宜,即使在10×时也是如此。

植物的另一个问题是一些物种是多倍体,使测序和基因组组装复杂。多倍体植物在较短的读取可以映射到两个,三个或四个不同的位置之间具有正交的区域。通常,多倍体植物基因组的质量低于动物或人类基因组。

“测序可能变得如此便宜,以至于GBS将取代SNP阵列。较高的产量和较低的价格可能会改变未来的成本结构。”

问:您认为GBS将替换SNP阵列基因分型吗?

高清:今天的牛和绵羊中的大多数常规基因分型是用SNP阵列进行的,该SNP阵列执行,该阵列目前提供比GB更低的价格点的高质量数据。GBS存在一些问题,因为它的低覆盖序列难以区分序列错误和真正的等位基因。SNP芯片还能够比基于序列的基因分型较低的质量DNA,这有助于行业应用。

据说,我开放思想GBS或SNP阵列是否将来最好。我专注于以最低价格提供最高质量的数据。序列可能会变得如此便宜,GBS将取代SNP阵列。较高的输出和低价Novaseq 6000系统可能会在将来改变成本结构。

问:什么是对1000牛基因组计划的下一步?

高清:我们在开发中有纸质涵盖我们新一轮的测序,数据分析和参考基因组。我们所有38家合作伙伴机构也都在发布数据。

我们已经测试了几种不同的调用程序,并将从SAMtools转移到GATK HaploType调用程序14.在下一轮分析中。我们将增加1000牛种族基因组数据库到超过3000个牛基因组,包括更多的公共数据。我们希望随着我们迁移到我们的新的,更大的参考基因组,我们将看到数据质量的增加和提高避难,以提供更好的结果。

yobet亚洲亚博官网人口了解有关本文中提到的系统的更多信息:

Hiseq 3000系统

miseq系统

nextseq 550系统

NovaSeq 6000系统

工具书类
  1. 农业维多利亚,agriculture.vic.gov.au /农业.获得2019年1月3日。
  2. 1000牛种族基因组项目,www.1000bullgenomes.com/.获得2019年1月3日。
  3. 海耶斯BJ和Daetwyler HD。1000牛种族基因组项目在牛中映射简单且复杂的遗传性状:应用和结果。Annu Revian Biosci. doi:10.1146/annurev-animal-020518-115024.打印前的Epub。
  4. Bouwman Ac,Daetwyler HD,Chamberlain Ja,等。对牛身材的全基因组关联研究的荟萃分析鉴定了调节哺乳动物体尺寸的常见基因。NAT Genet..2018; 50:362-367。
  5. dai twyler HD, Capitan A, Pausch H等。对234头牛的全基因组测序有助于绘制牛的单基因和复杂性状。NAT Genet。2014; 46:858-865。
  6. Pausch H,Emmerling R,Gredler-Grandl B等人。对三个牛品种进行基于序列的关联研究的荟萃分析显示,在核苷酸分辨率下,牛奶中脂肪和蛋白质的比例有25个QTL。BMC基因组学.2017; 18:853。
  7. Michot P,Fritz S,Barbat A等人。在PFAS(phosphoribosylformylglycinamidine合成酶)的错义突变是在蒙贝利亚奶牛MH1单倍型相关的胚胎致死可能的因果J Dairy Sci..2017; 100:8176-8187。
  8. 张志强,张志强,张志强,等。来自全基因组序列数据的数量性状位点标记增加了基因组预测的可靠性。J Dairy Sci..2015; 98:4107-4116。
  9. Vanraden Pm,接受了我,O'Connell JR等人。选择序列变体以改善乳制品的基因组预测Genet Sel Evol..2017; 49:32。
  10. Raymond B,Bouwman Ac,Schrooten C,等。全基因组序列数据的效用,用于跨越基因组预测。Genet Sel Evol。2018; 50:27。
  11. Macleod Im,Bowman PJ,Vander Jagt CJ,等。利用生物前驱和序列变体增强了复杂性状的QTL发现和基因组预测BMC基因组学.2016; 17:144。
  12. 羊基因组数据库,羊基因组社区资源,Sheepgenomesdb.org/.获得2019年1月3日。
  13. 欧洲变异档案,www.ebi.ac.uk/eva/.获得2019年1月3日。
  14. Gatk。单倍型来电呼叫系列SNP和通过本地重新组装单倍型重新装配。software.broadinstitute.org/gatk/documentation/tooldocs/3.8-0/org_broadinstitute_gatk_tools_walkers_haplotypecaller_HaplotypeCaller.php。访问2018年11月29日。