客户面试

大规模的牛基因组测序使畜牧业快速改善

WGS 1000年牛基因组项目的数据帮助发现积极的和消极的特征,惠及全球牛群。

大规模的牛基因组测序使畜牧业快速改善

大规模的牛基因组测序使畜牧业快速改善

介绍

执行全基因组测序(WGS)牛人的最佳方法是使用当前基因组分析技术来评估牛品种的遗传变异。然而,此选项仍然是遥不可及的金融对于大多数育种家和研究人员。因此,常规pcr的公牛,母牛,母牛是使用更便宜的单核苷酸多态性(SNP)执行数组。SNP数组是用来发现基因变异与积极的生产和健康特征有关,或者与疾病和其他消极的特征。

2012年,本·海斯博士,那么农业维多利亚1,1000年成立了牛基因组项目2帮助全球牛遗传学的理解和促进国际合作。3项目的初始运行测序238只动物从一个澳大利亚关键祖先公牛选择线为10.5×平均基因组覆盖率HiSeq 3000系统。项目现在包括40个国际合作伙伴,2700奶制品和牛肉的动物,已经确定了接近9000万的遗传变异。世界各地的研究人员和育种者正受益于发现由这些数据,包括致命的突变的识别4最大的规模序列水平全基因组关联研究(GWAS)在牛。5汉斯Daetwyler博士,高级研究员拉筹伯大学和农业维多利亚在墨尔本,澳大利亚,现在领导着1000牛基因组项目。他的团队正在计划明年中的另一个运行包括更多的动物。

iCommunity Daetwyler博士与学习项目是如何产生,它的各种研究yobet亚洲成果,未来使用WGS识别变异与积极的和消极的特征在其他繁殖的物种。

汉斯Daetwyler博士,高级研究员拉筹伯大学和农业在墨尔本维多利亚,澳大利亚。

问:什么是1000牛基因组项目吗?

汉斯Daetwyler (HD):1000牛基因组项目最初提出的本·海斯博士,他是我的老板在农业维多利亚。当时,测序是昂贵的执行大量的动物和防止其广泛使用在新老品种的研究。机构没有足够资金序列个人使归责,统计推断的未被注意的基因型在低密度snp阵列数据。

1000牛基因组联盟背后的想法是比较牛的全基因组序列,包括,Bos Indicus和其他Bos物种。当我们发表第一篇论文,1000牛基因组项目包括234头牛5个人和全球合作伙伴机构。5从那时起,我们新一轮的分析几乎每年运行。每次运行增加了更多的动物,与更多的伙伴机构加入该项目。迄今为止我们已经测序2700多动物。

问:什么是你的角色1000牛基因组项目开始的时候?

高清:我进行数据分析前几年的项目。合作伙伴给我们一个参考基因组的全基因组序列对齐。我们分析了BAM文件,结合数据,调用者,跑一个变体识别单核苷酸多态性和indels数据集。我们为我们的合作伙伴提供了原始的列表和过滤SNPs和相关的基因型项目中所有的动物。今天我们继续这一进程。

当海斯博士搬到昆士兰大学在2016年,我接任主席的指导委员会1000年牛基因组项目。

“如果农民有一个更精确的EBV小牛出生时或者在很小的时候,他们可以自信地选择和使用这些个人饲养比他们原本可以拥有的更早。它缩短了乳制品牛世代间隔5 - 6年2年。”

问:什么工具和方法研究人员一直使用识别因果变异?

高清:十年前,他们使用低密度SNP数组来识别一个关联的基因区域,可能表现的目标序列区域识别其他变体。当时,测序是一个缓慢的,昂贵的过程。研究人员会使用旧门店技术进行有针对性的测序,然后只在动物他们怀疑的航空公司的数量性状位点(QTL)定位。他们没有参考基因组,所以他们没有一个好主意去哪里看或基因的数量。他们可能发现使用这种方法只有少数的突变。

1000牛基因组项目数据库包含基于许多动物的全基因组序列。它加快了因果变异显著发现过程,改善种群的遗传增益。

问:为什么它是重要的遗传增益提高利率在奶制品和牛肉吗?

高清:除了营养和健康管理、遗传变化是一个重要组成部分增加生产力和效率,以及改善卫生福利特征在一群。遗传增益是累积的。随着时间的推移,它就像复利。每次做出的积极改变基因的更好的性能或改善健康和福利,它仍然是混合群和积极的影响。相当重要组成部分农民的精力都花费在随着时间的推移增加牛群的生产力。

问:什么是基因组选择的好处相比,以前的选择育种方法?

高清:基因组学之前,农民使用表型选择,涉及观察个人及其后代,为育种选择个人根据他们的特点。他们也用谱系选择使用近亲的信息。

基因组选择的力量在于,它与生产、信息相结合,效率和健康数据在更遥远的亲戚。基因组选择导致的增加的准确性(EBV)估计育种值,特别是对于年轻的个体。如果农民有一个更精确的EBV小牛出生时或者在很小的时候,他们可以自信地选择和使用这些个人饲养比他们原本可以拥有的更早。它缩短了乳制品牛世代间隔5 - 6年到2年。

问:多少百分比的牛牲畜饲养者正利用基因组选择改善牛群?

高清:使用基因组选择奶制品和牛肉农民之间的不同。表型选择相比,基因选择允许使用年轻的公牛没有女儿。中使用这些年轻的基因测试雄在过去的几年中有了长足的进步。在一些国家,这个比率是80%以上的总使用人工授精技术(AI)获得。在澳大利亚,中使用基因测试雄是40%左右。在澳大利亚牛肉,这将是一个比例低于乳制品,但是相当高的主要在北美牛肉品种。

”项目中所有的动物已经或将重新新参考基因组从农业研究服务加州大学戴维斯。我们希望改进的数据对每个人都向前发展。”

问:什么是测序的祖先公牛的价值与挥动与Sanger测序?

高清:寻找因果或near-causal突变仅仅是可能的如果你有上天的全基因组序列组成的大型数据集。上天让我们序列明显更多的动物比Sanger测序以较低的价格点。门店改善了归责的准确性和效率,我们可以推断序列表型在个人,只有一个SNP基因型数组评估。这是最大的优势。

门店影响功能基因组研究的好处。RNA-Seq和染色质免疫沉淀反应(芯片)seq门店提供一组个体的功能信息。我们在寻找利用这些信息near-causal突变,我们可以直接基因型。这些突变的基因直接也会增加预测精度在品种和个体不太相关的培训。

问:如何确认关键祖先公牛?

高清:有几种方法用来识别关键祖先公牛。的主要方法是选择一个谱系和确定哪些个人解释大部分的遗传变异血统。新方法使用基因型,甚至单的人口多样性。关键的祖先选择基于他们是否拥有的大多数单或一个强有力的补单体型集代表的人口。另一种方法是看个人,单还没有覆盖在测序的个体。

问:什么是个体的总数已经测序和牛品种中包括1000牛基因组数据库?

高清:我们已经超过了我们最初的1000人的目标。最后分析来看,我们有超过2700人,我们要开始一个新的运行1000多头。项目中所有的动物,或将重新新参考基因组从农业研究服务加州大学戴维斯。我们希望改进的数据为每个人。

有稍微乳制品品种组比牛肉组在1000牛基因组数据库。项目的主要品种群黑白花牛在20%左右。安格斯是第二大组,其次是棕色的瑞士。我们也有双重目的的牛在数据库中,包括西门塔尔牛和Fleckvieh。最近,有不少Bos indicus贡献,包括来自澳大利亚的婆罗门。

问:有多少新牛标记已确定1000年牛基因组团队?

高清:在我们开始1000牛基因组项目之前,研究人员使用了600000个变异分析。在240年第一次运行执行与动物,我们确定了25−2700万个snp和indels金牛座一个人。我们现在约4000万个人只。当你包括Bos indicus牛、牦牛和其他亚种,大约8000万过滤变体。

“1000牛基因组数据库加速的步伐牛研究通过早期使用在动物育种WGS数据。”

问:什么是1000牛基因组数据库的价值研究人员?

高清:1000年的公牛ReferenceGenomes数据集是有价值的研究人员在两个方面。首先,研究人员可以使用它作为参考将转嫁全基因组序列数据集与SNP群个体的基因型数组。他们可以执行强大的GWAS和调查不同的基因选择方法,利用WGS。4

它还允许研究人员寻找病因或致命的隐性疾病突变。使用1000牛基因组数据集控制,研究人员可以使用过滤策略缩小他们的搜索小基因组区域。

问:此数据库提供给研究者在世界任何地方吗?

高清:1000牛基因组数据库可用研究机构加入了这个项目,并同意与该财团分享他们的数据。很少有限制的类型研究与数据执行。然而,该财团的研究人员不允许共享数据以外的机构。例如,如果一个研究合作者谁想分析1000牛基因组数据,合作者必须成为一个项目的成员。

目前,有38个机构全球项目。1000牛基因组项目培养几个重要合作。这是它的一个持久的遗产。

问:什么样的发现了与1000年牛基因组数据库?

高清:WGS 1000牛基因组数据库中的数据是有价值的,支持大量繁殖和研究应用。研究人员使用了1000牛基因组数据库确定积极的变异数牛奶产量性状。6也有一些因果变异,已确定使用数据。例如,我们法国同事发现的因果变异胚胎致死突变,此前没有被发现,尽管我们知道他们的存在。7

sequence-level GWAS改善我们的理解特征结构和功能研究的支持。例如,WGS数据使得归咎为QTL研究。研究人员还用WGS数据识别和优先SNP集来提高基因预测。8 - 11

“HiSeq系统提供高吞吐量,所以我们可以执行WGS, RNA-Seq,和低价ChIP-Seq点。数据质量很好和系统已经我们的WGS劳力。”

问:这些发现影响育种者吗?

高清:1000牛基因组数据库有加速的步伐牛研究通过早在动物育种中使用的WGS数据。致命的突变的发现有立即对育种者产生积极影响。突变被发现时,他们立即添加到SNP序列确定运营商成群活动。这些人选择对禽流感的过程,进而减少致命的突变的频率在群体人口。

我们现在有一个更完整的SNP和indel库存变化我们所有的人群,能够设计出更好的SNP数组。而不是依靠随机单核苷酸多态性,出席“足够好”的频率来推断它们是因果,我们知道我们可以用单核苷酸多态性丰富数组是因果,直接影响特征。

问:你使用哪个门店系统执行WGS ?

高清:我们执行排序与两个HiSeq 3000系统和我们也有MiSeq NextSeq 500系统。HiSeq系统提供高吞吐量,所以我们可以执行WGS, RNA-Seq, ChIP-Seq以较低的价格点。数据质量很好和我们系统已经WGS劳力。我们使用MiSeq系统应用程序需要稍长一些的读取。

我们调查是否升级HiSeq系统NovaSeq 6000系统,这将使我们能够执行大规模WGS和基因分型结果进行排序(GBS)在一个乐器。

问:1000牛基因组的方法创建一个物种数据库基因组的测序1000年代被用于其他牲畜或植物吗?

高清:我们使用这种方法在一个类似的项目为羊,SheepGenomesDB。12我们测序935只羊,从NCBI或EBI短内容下载原始数据序列的档案,并处理与合作者一起如AgResearch在新西兰和澳大利亚布里斯班。我们进行变异召唤,创造了*。vcf文件与基因单核苷酸多态性,indels,归档数据发表在欧洲变体。13

我认为这个概念会在植物也有值得肯定之处。我肯定它已经被用于拟南芥和一些主要的农作物。然而,一些植物有非常大的基因组。小麦基因组170亿个碱基对。这使得WGS更加昂贵的执行,使共享数据成为当务之急。我们进行外显子组测序在小麦,部分原因是低的价格。相比之下,油菜短基因组12亿个碱基对。使其执行WGS相对便宜,即使在10×。

植物的另一个问题是,一些物种多倍体,基因组测序和组装复杂。多倍体植物之间的同源区域subgenomes短阅读可以映射到两个,三个或四个不同的地方固执地平等的准确性。通常,多倍体植物基因组比动物或人类基因组的低质量。

“可能是,测序将成为如此廉价,GBS将取代SNP数组。更高的产量和更低的定价NovaSeq 6000系统可能会改变未来的成本结构。”

问:你认为GBS会取代SNP基因分型结果数组?

高清:今天在牛羊最常规的基因SNP数组执行,目前以更低的价格提供高质量的数据比GBS点。GBS出现了一些问题,因为它的信号低排序很难区分错误和真正的等位基因序列。SNP芯片也可以采取低质量DNA序列的基因,这有助于在工业上的应用。

那就是说,我开放的GBS或SNP数组是否在未来将是最好的。我专注于任何方法以最低的价格提供最优质的数据。测序可能会变得非常便宜,GBS将取代SNP数组。更高的产量和更低的定价NovaSeq 6000系统可能会改变未来的成本结构。

问:什么是接下来的步骤1000牛基因组项目吗?

高清:我们在开发覆盖新一轮的排序,数据分析,和参考基因组。我们所有的38个伙伴机构也发布数据。

我们已经测试了几种变体呼叫者和将从SAMtools GATK单体型调用者14下一轮的分析。我们将增加1000牛基因组数据库超过3000头牛基因组,包括更多的公共数据。我们希望当我们搬到新的、更大的参考基因组,我们将看到数据质量的增加和改进的归责提供更好的结果。

yobet亚洲亚博官网人口了解更多关于本文中提到的系统:

HiSeq 3000系统

MiSeq系统

NextSeq 550系统

NovaSeq 6000系统

引用
  1. 农业维多利亚,agriculture.vic.gov.au /农业。2019年1月3日通过。
  2. 1000牛基因组项目,www.1000bullgenomes.com/。2019年1月3日通过。
  3. 海耶斯BJ Daetwyler高清。1000牛基因组项目映射简单和复杂遗传性状在牛:应用程序和结果。为动物Biosci。doi: 10.1146 / annurev -动物- 020518 - 115024。Epub提前打印。
  4. Bouwman AC, Daetwyler高清,张伯伦JA等。荟萃分析的全基因组关联研究牛形象识别常见的基因调节哺乳动物的体型。Nat麝猫。2018;50:362−367。
  5. Daetwyler高清,队长,Pausch H,等。全基因组测序234公牛促进映射的单基因和复杂特征的牛。Nat麝猫。2014;46:858−865。
  6. Pausch H,艾默灵R, Gredler-Grandl B, et al。荟萃分析的序列关联研究跨三个牛品种显示25 QTL对牛奶中脂肪和蛋白质百分比核苷酸决议。BMC基因组学。2017;18:853。
  7. Michot P, Fritz年代,Barbat,等。错义突变在pfa (phosphoribosylformylglycinamidine合酶)可能是因果相关胚胎杀伤力MH1 Montbeliarde奶牛的单体型J乳品科学。2017;100:8176−8187。
  8. Brøndum射频,苏G, jans L,等。数量性状位点标记来自全基因组序列数据增加基因预测的可靠性。J乳品科学。2015;98:4107−4116。
  9. VanRaden点,花了我,小奥康奈尔,等。选择序列变异来改善奶牛的基因预测麝猫选取另一个星球。2017;49:32。
  10. 雷蒙德•B Bouwman AC, Schrooten C, et al。全基因组序列数据的效用across-breed基因组预测。麝猫选取另一个星球。2018;50:27。
  11. 麦克劳德IM,鲍曼PJ,范德Jagt CJ,等。利用生物学先验和序列变异提高QTL发现和基因预测复杂的特征BMC基因组学。2016;17:144。
  12. SheepGenomesDB,绵羊基因组学社区资源,sheepgenomesdb.org/。2019年1月3日通过。
  13. 欧洲变异存档,www.ebi.ac.uk / eva /。2019年1月3日通过。
  14. GATK。单体型Caller-Call生殖系单核苷酸多态性和单体型indels通过本地维护。software.broadinstitute.org/gatk/documentation/tooldocs/3.8-0/org_broadinstitute_gatk_tools_walkers_haplotypecaller_HaplotypeCaller.php。2018年11月29日访问。