客户面试

见证了测序能力的巨大变化

三位杰出人士就高通量和群体测序在临床研究中的影响以及它们在未来医学中的作用提供了他们的观点。

见证了测序能力的巨大变化

见证了测序能力的巨大变化

介绍

测序技术远远超过了DRS的期望。Carlos Bustamante,Stephen Kingsmore和John Mattick。如果您在职业生涯的开始,如果有一天我们可以在一天中排序整个人类基因组,他们的回答分别是:“疯狂的谈话!”,“绝对没有。”“不是我最疯狂的梦想。”

尽管测序创新的速度让他们感到惊讶,但他们都很快采用了下一代测序(NGS),现在是人口测序,以推进他们的研究和翻译工作。作为遗传学和生物医学数据科学教授,以及斯坦福计算、进化和人类基因组学中心的创始主任,布斯塔曼特博士正在使用人口测序来了解古代和种族亚种群的遗传差异。作为雷迪儿童基因组医学研究所(Rady Children’s Institute for Genomic Medicine)的总裁兼首席执行官,Kingsmore博士正在利用该研究所开发儿童基因组医学的证据基础。作为Garvan Institute of Medical Research的执行董事,Mattick博士领导了将人口测序数据用于研究和临床应用的努力。

iCommunity与Bustamante博士、Kingsmore博士和Mattick博士讨论了他们的团队如何利用高通量全人类基因组和群体测序来推进研究和翻译研究,以及对合并“组学”和表型数据的数据库的需求,以及将这些信息转换成在临床环境中有用的格式的挑战。

alt text去这里
从左到右:Carlos Bustamante博士是遗传学和生物医学数据科学教授,斯坦福大学计算、进化和人类基因组学中心的创始主任;Stephen Kingsmore博士是雷迪儿童基因组医学研究所(Rady Children’s Institute for Genomic Medicine)的总裁兼首席执行官;约翰·马提克博士是加文医学研究所的执行主任。

问:当你第一次成为科学家时,测序技术是什么样子的?

约翰·Mattick (JM)我的第一个测序记忆在Autoroadiograms上的乐队上凝视。这是分子生物学的早期。我们克隆和测序基因。我们以为我们是热门。在乐队太紧以区分之前,我们只能从凝胶中读取几个100个基础。我们将组装一个1-2千面板长的序列,每个纸都是一个单独的纸张。回顾一下,似乎是如此原始。

斯蒂芬·金斯默尔(SK)我的测序经验始于放射性p32标记、琼脂糖和聚丙烯酰胺凝胶。一个伟大的测序反应是150个核苷酸,这花费了一天的大部分时间。

Carlos Bustamante(CB)随着自动测序仪的发展,我成为了一名科学家,所以我做了一些手工测序然后在第一代测序仪上做了大量的测序。我的第一次经历是在史密森尼博物馆做实习生,那里刚刚成立了分子分类学实验室。当时,对多个个体的几个基因进行测序是一件大事。

问:随着工具的改进,您的排序方法发生了怎样的变化?

CB一开始,我们把每一条数据都当作是宝贵的。当Celera开始进行早期外显子组测序时,他们对200000个样本进行了PCR,并对20000个基因中的39人进行了测序。我想,“这是一个数据集!我们已经等了很长时间了。”我们停止了我们正在做的事情,花了4-5年的时间研究39个外显子,并写了8-9篇论文以不同的方式分析数据。这种心态已经被颠覆了。我们现在正在使用NGS快速、持续地生成数据,然后担心它意味着什么。

“获得准确变异信息的唯一方法是为成千上万的基因组提供可用的信息,这样我们就可以评估我们看到的每一个变异的频率。”

问:当下一代测序(NGS)工具被引入时,您将它们融入研究的速度有多快?

CBNGS很快成为我们研究的关键工具。我们是猕猴和猩猩基因组项目的一部分,在那里我们分析多态性数据。我们也是1000个基因组项目的原始分析组之一,在美洲设计取样,确定2的值´–4´排序和方差频率的界限。

SK我们在NGS系统上市后不久就开始使用它们。那是激动人心的日子。我们把我们的邮件室改造成了NGS实验室。对人类基因组知之甚少,所以我们在每一项研究中都发现了新的东西。

吉咪多年来,我一直是新基因组学技术的早期采用者。与Craig Venter一起,我是分子动力学Megabase sequencer的首批客户之一。Garvan学院是首批获得HiSeq X Ten系统的三家机构之一。

问:您的早期测序工作如何影响您当前研究的重点?

CB在早期,我们看到了感兴趣的基因的多态性和变异。在我的博士论文中,我分析了当时最大的基因组数据集,其中有25个果蝇的基因序列跨越多个个体,15个拟南芥的基因序列跨越多个植物。我们研究了氨基酸的差异以及有益和有害突变的积累。从那一刻起,我开始考虑创建一个人类序列的大数据集,这样我们就可以用同样的方法来分析它。

SK在国家基因组资源中心,我们使用早期的NGS对转录组进行测序,然后是植物和病原体的基因组,然后开始对人类样本进行测序。我们中的一些人意识到,我们在研究环境中进行的研究将很快开始影响医疗保健。在走遍了全国之后,我们三个人搬到了堪萨斯城的儿童仁慈医院,建立了第一个儿童基因组学医学中心,并开始进行转化研究。我现在在雷迪儿童基因组医学研究所我们在那里更进一步,专注于基因系统医学在加州最大的儿童医院的大规模实施。

吉咪高通量测序对人类基因组的转录复杂性的升值产生了巨大影响。NGS加速了我们潜入转录组的能力,使我们能够探索非蛋白质编码转录物的非凡世界,其在发育过程中在不同细胞和组织中的精确模式中从基因组中倒出。我现在想到了人类基因组作为.zip文件AredringInaire。人类基因组的转录复杂性至少比基因组本身更复杂的数量级,并且它可以以不同的方式解压缩,在不同时间在不同细胞中具有不同的表达和非编码RNA的剪接模式。如果没有高吞吐量排序,我们就无法探索这个世界。

“在基因组学的新世界里,每个学生、博士后、实验室和系里都需要有处理和分析大数据的能力。”

问:你今天是如何使用NGS的?

CBNGS为群体基因组学开辟了新的途径。我记得在一次冷泉港会议上,我意识到1000个基因组项目应该包括混合基因组。人们对此提出质疑,但我认为,为了分析和进行跨种族和多民族研究,我们需要弄清楚如何理解混合基因组。

One of the reasons we became involved in the Clinical Genome Resource (ClinGen) Consortium was to aggregate clinical genetic testing data and chip away at the variant of uncertain significance (VUS) rate, which is higher in certain ethnic minority groups simply because there haven’t been as many of these sequences analyzed. NGS made it inexpensive and easy to follow up on these genome-wide association study (GWAS) hits. Each amino acid change we found was a smoking gun. It became clear that we needed to broaden ethnic representation in human DNA studies if we really wanted to develop genomic medicine that benefitted everybody.

SK我们将重点放在全基因组测序(WGS)上,因为这是最终的分子测试。WGS的速度也更快,我们与Illumina合作开发了一种方法,使我们能够在26小时内解码和分析整个人类基因组。1这是我们计划提供快速WGS每一个未确诊的儿童在我们的新生儿和儿科重症监护病房(针对新生儿重症监护室医生和儿童重症监护室医生)在明年,并进行临床研究定义基因组医学的临床效用和成本效益的儿科住院和门诊设置。

问:HiSeq X系统能让你学习什么?

CB人口测序是我一直想做的分析许多人类基因组的工作的顶峰。我们正在进行大规模群体测序研究,将其作为回答重要群体遗传学问题的基线,并分析结果,为临床医学的新方法提供信息。例如,我们正在秘鲁进行一项先兆子痫研究,采用大规模基因分型和测序相结合的方法,研究海拔适应与先兆子痫的关系。

SK使用HiSeq X系统,基因组的成本要低得多,因此我们可以对更多的三联体进行测序。有8000种命名的遗传病,我们和其他人强烈感觉到NGS将改变我们识别它们的能力。我们希望使用HiSeq X和Illumina SeqLab基础设施逐步开发支持这一点的证据库。

吉咪Garvan研究所是最早将基因组学置于其研究工作中心的研究所之一,而不是传统分子生物学的延伸。随着基因组测序的非凡进步和随之而来的成本降低,利用群体测序并将基因组学置于研究和临床的中心已变得经济可行。

HiSeq X系统使翻译和研究工作得以合并,这是非常了不起的。我们一直在与世界各地的研究人员合作。HiSeq X Ten系统运行良好。

除了研究单基因疾病外,我们还在癌症、糖尿病、骨质疏松症、免疫性疾病、神经退行性疾病和神经精神疾病以及老龄化等主要研究项目中使用人群测序。作为国际癌症基因组联盟(ICGC)的一部分,我们正在进行癌症分层研究,并使用NGS破译癌症基因组,评估家族癌症风险的遗传成分。我们正在对1型糖尿病患者进行测序,以发现这些患者在一生中表现良好的人与那些在以后生活中遭受严重并发症(如肾衰竭)的人之间的基因差异。在我们的老龄化研究中,我们使用人口测序来研究几千名没有任何心血管、癌症、认知衰退或神经退行性疾病迹象的老年人。我们正在开发一个风险耗尽队列,我们可以将其用作研究患有此类疾病人群的对照。其他正在使用HiSeq X Ten测序能力的项目是研究患有心脏病、线粒体病和阿尔茨海默病的人群。

“我们最大的挑战是学习如何共享人口测序数据。”yobet亚洲

问:共享人口测序数据面临哪些挑战?

CB我们最大的挑战是学习如何共享人口测序数据。NIH和yobet亚洲其他组织现在要求研究人员共享他们的数据。不幸的是,临床数据并非如此。大多数医院没有共享数据的真正宗旨。我们还生活在一个相互联系的世界,这让患者在分享信息时感到不舒服。在这方面,全球基因组学与健康联盟和其他实体的努力将在制定前瞻性同意、隐私程序以及数据治理和透明度方面的最佳实践方面发挥重要作用。

SK在我们能够在Rady儿童医院对基因组进行测序之前,父母必须给予知情同意。同意过程的一部分是我们能够发布基因组的协议。我们对其进行去识别,因此没有任何信息可以将基因组与孩子或父母联系起来,然后这些信息可以在国家生物技术信息中心(NCBI)基因型和表型数据库(dbGaP)上获得,这是一个私人数据库。研究人员只有在向国家卫生研究院提出申请并为他们的研究提供需要获取信息的充分理由后,才能获取数据。它似乎在隐私问题和其他研究人员能够研究公共基因组的好处之间提供了一个很好的平衡。

不幸的是,并非所有医院都有基因组共享知情同意程序。临床研究人员需要人类全基因组序列信息进行基准测试。他们想知道基因变异在基因组中有多普遍。要获得准确的变异信息,唯一的办法就是要有几十万个基因组,这样我们才能评估我们所看到的每一个变异的频率。

Q:整合WGS、表观基因组、转录组和其他基因组和表型数据以获得不同的基因组快照的价值是什么?

CB进行各种组学分析、RNA序列分析、甲基组测序等都有重要价值。我们仍然不了解人体的调节网络。我们今天是否在执行和整合组学数据?我认为它发生得很慢,部分原因是因为排序比解释容易得多。

SKpanomics绝对有价值,我们将全基因组数据与深层表型、表观遗传学、基因表达、代谢组学和蛋白质组学数据结合起来。基因组测序并不是游戏的结束,但它是一个伟大的开始。我们开始了解我们需要什么来提供精确医学。例如,我们不知道我们在基因组中看到的大多数变异在功能上意味着什么。因此,我们无法对它们是否能给人类带来改变做出自信的评估。很明显,我们需要更多类型的数据才能进行大规模评估。

吉咪临床研究和医学的未来将围绕大数据集的集成展开。它不仅仅是单个和合并的基因组数据集。这些数据将越来越多地与转录组学、表观基因组学、蛋白质组学以及最重要的表型数据合并,以创建高度关联、信息丰富的数据集。医学正迅速向大数据迈进,数万和数十万基因组序列的获取将加速这一进程。这将改变一切。

“礼貌肯定有价值,在那里我们正在服用全基因组数据,并将其与深素,表观遗传,基因表达,代谢组和蛋白质组学数据一起带来。”

问:生物信息学和数据库在获得群体测序的全部价值方面有多重要?

CB从一开始,很明显,我们必须将测序与分析工具结合起来,才能理解所有数据。通过连接和分析表型和基因型信息,我们可以开始解开我们无法从静态数据中看到的模式。有人乐观地认为,如果我们以更严格的方式测量表型和暴露,我们可以收集大量数据,帮助我们确定基因关联。

吉咪我认为生物信息学框架和数据库是整个努力的核心。它将整合基因组数据和正交数据集,以提取有价值的信息。我们确定的遗传模式将有助于告知临床中的个人情况,并通过对元数据的分析,从疾病模式、共病率等方面告知整个卫生系统。

人口排序不适合胆小鬼。在过去的1-2年中,我们投入了大约1000万美元用于构建计算管道。我们有一个由60人组成的不断壮大的团队,负责整个装配流水线的工作,执行测序、装配数据、调用变异和群体间的变异差异,并将数据与表型数据联系起来。

在基因组学的新世界中,每个学生、博士后、实验室和系都需要具备处理和分析大数据的能力。这不是走廊尽头的专家要做的事。它是整个研究和医学努力的核心。这是一个数据驱动的世界,我们正冲向它。

SK我们在最近的一项研究中认识到了生物信息学的价值,该研究比较了WGS和传统基因检测在危重新生儿孟德尔疾病识别中的有效性。2为了分析数据,我们开发了一些新的生物信息学工具。这篇论文证明了基因组测序的有用性,但我们需要进一步的证据来证明基因组学的临床价值。我们还需要一种精简的方法,将结果告知临床医生,不仅用于诊断,还用于NGS数据如何为治疗决策提供信息。

问:需要什么样的数据库?

吉咪我们需要国家级的基因型/表型相关数据库,这些数据库由卫生当局维护,可由经认证的研究人员和临床医生查询。它们必须是国家数据库,因为每个司法管辖区都有特殊的法律和其他上下文要求。不知何故,它们需要连接到一个全球数据库中,以便在一个国家生成的数据可以用于其他地方,并以多层面的方式进行探索,以促进我们对人类生物学和疾病的理解。

“我认为最广泛意义上的人口规模测序将从儿童开始,可能从出生时开始,以取代目前的格思里测试。”

问:创建这些数据库需要多长时间?

吉咪我们不可能一夜之间对世界上的每个人进行测序,但我相信在十年内我们将拥有大型基因组数据库。基因组数据将日益成为医疗记录的标准部分。理想情况下,我们将在云中拥有精心策划、基于证据的基因型/表型相关数据库,这些数据库由国家资源维护并不断更新。

最初的使用将是具有严重遗传残疾的个体,因为我们可以非常快速地诊断大约一半的病例中的致病性突变。癌症分层将是一个重要的领域,使医生能够确定疾病的分子基础,从而更有效地治疗疾病。第三个区域将是检测不良药物反应的遗传标志,因为这对每个国家的医院系统都是巨大的负担。我们将能够通过基因组信息预测和避免那些高比例的不良反应。

我们建议澳大利亚卫生系统将每个患有发育和/或智力残疾的人作为一线诊断的顺序。我希望在接下来的2-5年里,这将成为惯例。我认为最广泛意义上的人口规模测序将从儿童开始,可能从出生时开始,以取代目前的格思里测试。下一代的孩子将是基因组一代,随着技术和信息价值的提高,基因组测序和分析将被有选择地应用,然后应用范围会更广。

问:你认为WGS会成为常规临床试验吗?

吉咪我们接近排序是经常使用的作为体检的一部分。测序的成本将继续下降,使得进行再分析以提高某人的主要基因组数据的准确性,以掺入表观脑和转录组数据的准确性,或看躯体变异。随着我们获取有关生物学和医学中基因组意味着什么变异的更多信息,测序值将上升。在医学中更高使用测序现在受到坐在该信息分析后的数据库的丰富性和质量的限制。

值得注意的是,美国医学遗传学家学院(ACMG)已授权报告56个基因,因为这可能对患者未来的健康产生重大影响。我们将开始看到经过充分验证的基因集合,这些基因集合将被授权报告,或者在这一领域工作的组织将有信心向临床医生和患者报告,随着时间的推移,列表将不断扩大。

SK我们有一个丰富的新生儿筛查项目的传统,每个婴儿在出生时都有一个经过29种条件测试的脚跟棒。美国各地的几个研究小组正在开始调查,如果我们可以用基因组测序来取代脚跟棒,将会提供哪些额外的信息。我们还不知道。

“群体测序将使我们能够发现和描述与不良反应有关的临床可操作变异的全球等位基因频率。”

问:人类全基因组数据是否已经让我们更接近个性化医疗?

CB我认为基因组测序最终将成为常规护理的一部分,并成为人们电子健康记录的组成部分。这是一个有趣的时期,因为我们正处于一个过渡阶段。测序技术已经成熟,人们正在实施高通量测序,不久将进行常规人群测序。

我们需要制定一个协调一致的计划来收集、分析这些数据,并尽快将它们转化为健康效益。最终,我们需要为公众提供良好的投资回报。

SK将来,测序结果将通知治疗变化。传统上,诊断领域一直是病理学家和实验室人员的家,而医疗实施则是医生和临床医生的角色。在基因组医学中,这两者将融合。这将是一个挑战,因为双方都不习惯让另一方参与这些任务或信息。

吉咪我认为问题在于我们对基因组的理解仍然有限。今天,我们只能准确地报告蛋白质编码序列中某些变异的影响。从文献中收集足够的证据和数据,自信地称之为可能具有医学意义的基因组其他部分的突变或变异,这是一项巨大的努力。通过人口排序创建的大型全球数据库将支持这项工作。这些数据库将包含反映突变谱和表型特征的序列,使查询能够确定新样本是否反映数据库中已有样本的症状和突变。

问:人口测序数据将如何改变医学?

吉咪人口排序将对医学产生深远的影响,将其从危机管理艺术转变为健康科学。我们现在了解到,个体基因组变异和我们的遗传特质会影响我们目前的健康,并增加未来疾病的风险,无论是2型糖尿病、癌症、类风湿性关节炎还是阿尔茨海默病。在许多情况下,预先警告是事先准备好的,使临床医生和患者能够实施策略来减少、避免或准备这些可能发生的情况。

SK我研究儿童中罕见的遗传病,这些遗传病很简单。我们现在有能力进行快速诊断,因此,这些疾病第一次成为开发和制造药物的成本效益高的地方。我们的希望是,基因组在诊断复杂疾病方面将越来越有价值,就像它们在单基因疾病方面一样。这将需要几十年的时间才能赶上,而人口研究对于缩小这一差距将非常重要。人口研究中令人兴奋的一件事是,我们开始重新定义如何基于遗传学而不是基于症状来描述疾病。

吉咪人口研究将为治疗学的发展提供信息,特别是在确定不良反应的遗传学方面。美国每年有10万人死于处方药的不良反应。3.在澳大利亚,至少2-3%的住院是由于处方药的不良反应。4

CB例如,阿巴卡韦是一种重要的HIV药物,研究人员已经确定了一种涉及阿巴卡韦超敏反应的HLA变体。这种变异在非洲人和欧洲人中的流行率很低,但在印度和亚洲的某些人群中有20%的突变频率。5如果这种变异的患者服用一次阿巴卡韦,他们就会变得非常不舒服。如果给他们两次,他们就会死。群体测序将使我们能够发现和描述与不良反应相关的临床可操作变异的全球等位基因频率。瓶颈将是让医生能够理解药物代谢信息,以便他们知道选择药物A和药物B,或者给予药物一半或两倍的剂量。

吉咪毒品公司也开始使用人口序列来确定过去的药物试验中的特殊响应者。如果他们可以分层人口并确定受访者的特定遗传背景,他们可以分析所涉及的生化途径。它们不仅救援失败的药物,它们在拯救响应者患者中,患者有效,潜在的救生处理。

“特别是在美国,我们需要对健康状况最差的种族人群进行人口排序,这样他们在医疗方面的负差距就不会增加。”

问:对种族亚群体进行排序有多重要?

CB事实上,我们拥有进行人口测序的技术是很棒的。然而,我们需要一个共同的努力,以便继续研究种族亚种群。如果没有这一计划,我们的重点将仍然是对大量同质人口进行测序,比如芬兰人或冰岛人。尽管这些努力很重要,但并不是所有人都能受益。特别是在美国,我们需要对那些健康状况最差的族群进行人口排序这样他们在医疗方面的负差距就不会增加。这是一个挑战,因为没有高层的倡议来资助这些努力。美国政府的精准医疗计划是一项巨大的努力,但它不能与英国和其他国家正在做的相比。特别是中国,中国将基因组学视为其发展计划的主要支柱之一。

问:1000美元的基因组已经或将产生什么影响?

SK好消息是,1000美元的基因组可以用于人口测序。我们在临床护理中需要的是将快速基因组测序的成本降低到1000美元的基因组水平,而这还没有实现。

吉咪1000美元的基因组是一个实际和心理的转折点。它改变了我们对技术和我们认为可能的事情的看法。它以一种我们从未预料或认为可能的方式激发了临床和研究工作的整合。人们现在认识到,我们即将从基因组学作为一种研究工具转变为一种日常临床分析工具。

“最终,智能设备将自动向云中报告基因组信息。这将把我们带到我们做梦都没想到的地方。”

问:当你第一次成为科学家时,你是否相信有一天人类全基因组测序可以在一天内完成?

CB我会说那是不可能的。疯狂的说话!

SK绝对不是。即使你把我带回到我第一个Solexa系统测序的时候,我也没想到我们会像现在这样快速地生产出基因组。

吉咪我做梦也想不到。在20世纪下半叶,我们刚刚开始了解DNA是什么样子,基因是什么样子,并开发出原始的基因组分析工具。当时,我们所做的一切都被认为是领先的,事实也确实如此。现在我们正以翘曲速度前进。21世纪将是生物学和医学的世纪。NGS与大数据的整合仍在进行中,并将在可预见的未来出现。最终,智能设备将自动将基因组信息报告到云端。它会带我们去我们做梦都没想到的地方。这是一个美妙而激动人心的时刻。我们很感激像Illumina这样的公司在技术上领先。

参考文献
  1. Miller NA、Farrow EG、Gibson M等。用于遗传病应急管理的26小时高灵敏度全基因组测序系统基因组医学. 2015; 7(1) 100. do:10.1186/s13073-015-0221-8。
  2. 等。全基因组测序鉴定危重婴儿孟德尔病:诊断和临床结果的回顾性分析柳叶刀呼吸医学. 2015; 3(5):377–387.
  3. 可预防的不良药物反应:重点是药物相互作用。美国食品和药物管理局。www.fda.gov/druges/DevelopmentApprovalProcess/DevelopmentResources/DrugInteractionsLabeling/ucm110632.htm.已于2016年5月16日生效
  4. 拉夫黑德L,森普尔S,罗森菲尔德E.文献综述:澳大利亚的药物安全性。www.safetyandquality.gov.au/wp-content/uploads/2014/02/Literature-Review-medicing-Safety-in-Australia-2013.pdf.2013年8月16日出版。2016年5月16日。
  5. 张志强,张志强,张志强,等。泰国和柬埔寨艾滋病毒感染儿童中人类白细胞抗原B*5701的流行率:阿巴卡韦使用的影响儿科感染性疾病.2013;32(3): 252 - 253。