客户面试

见证测序能力的巨大变化

三位杰出人士就高通量和群体测序在临床研究中的影响以及他们在未来医学中所扮演的角色提供了他们的观点。

见证测序能力的巨大变化

见证测序能力的巨大变化

简介

测序技术已经远远超出了博士们的预期。卡洛斯·布斯塔曼特,斯蒂芬·金斯莫尔,约翰·马蒂克。如果你在他们职业生涯的开始问他们,是否有一天我们可以在一天内对整个人类基因组进行测序,他们的回答将分别是:“疯了!、“绝对不行。”和“做梦都想不到。”

尽管测序创新的速度让他们感到惊讶,但他们都很快采用了下一代测序(NGS),现在是种群测序,以推进他们的研究和转化工作。作为遗传学和生物医学数据科学教授,斯坦福大学计算、进化和人类基因组学中心的创始主任,Bustamante博士正在使用种群测序来了解古代和种族亚群体的遗传差异。作为Rady儿童基因组医学研究所(Rady Children’s Institute for Genomic Medicine)的总裁兼首席执行官,Kingsmore博士正在利用该研究所开发儿童基因组医学的证据基础。作为Garvan医学研究所的执行主任,Mattick博士领导了利用人口测序数据进行研究和临床应用的工作。

iccommunity采访了一些医生。Bustamante, Kingsmore和Mattick谈到了他们的团队如何使用高通量的全人类基因组和种群测序来推进研究和转化研究,对合并“组学”和表型数据的数据库的需求,以及将这些信息转化为临床环境中有用的格式的挑战。

Alt文本在这里
从左至右:Carlos Bustamante博士是遗传学和生物医学数据科学教授,斯坦福大学计算、进化和人类基因组学中心创始主任;Stephen Kingsmore博士是Rady儿童基因组医学研究所的总裁兼首席执行官;约翰·马蒂克博士是加文医学研究所的执行主任。

问:当你刚成为科学家时,测序技术是什么样子的?

约翰·马蒂克(JM)我对测序的最初记忆是凝视自放射成像上的条带。那是分子生物学的早期。我们克隆和测序基因。我们以为我们是高手。我们只能从凝胶中读出大约100个碱基,否则这些条带就太紧了,无法区分。我们将组装一个1-2千碱基长的序列,每个序列都是一篇独立的论文。现在回想起来,似乎太原始了。

斯蒂芬·金斯莫尔(SK)我的测序经验始于放射性p32标记,琼脂糖和聚丙烯酰胺凝胶。一个伟大的测序反应是150个核苷酸,这花了一天的大部分时间。

卡洛斯·布斯塔曼特(CB)我成为一名科学家时,自动化测序仪正在开发,所以我执行了一点手动测序,然后在第一代测序仪上进行了大量测序。我的第一份工作是在史密森学会实习,当时他们刚刚成立了分子系统学实验室。当时,对来自多个个体的几个基因进行测序是一件大事。

问:随着工具的改进,你的测序方法发生了怎样的变化?

CB一开始,我们把每一份数据都当成珍贵的。当Celera开始进行早期外显子组测序时,他们对20万个样本进行了PCR,并对39人的2万个基因进行了测序。我想,“这是一个数据集!我们为此等待了很长时间。”我们停下手头的工作,花了4-5年时间研究了39个外显子体,写了8-9篇论文,用不同的方法分析数据。这种思维模式已经被颠覆了。我们现在用NGS快速而持续地生成数据,然后担心它意味着什么。

“获得准确变异信息的唯一方法是获得数十万个基因组,这样我们就可以评估我们看到的每一个变异的频率。”

问:当新一代测序(NGS)工具被引入时,您多快地将其纳入到您的研究中?

CBNGS很快成为我们研究的重要工具。我们是猕猴和猩猩基因组项目的一部分,我们分析了多态性数据。我们也是1000基因组计划的原始分析小组之一,设计了美洲的抽样,确定了2的值´4´排序,和方差频率的界限。

SKNGS系统上市后不久,我们就开始使用它们。那是激动人心的日子。我们把收发室改成了NGS实验室。我们对人类基因组所知不多,所以我们在每一项研究中都有新发现。

JM多年来,我一直是基因组学新技术的早期采用者。与克雷格·文特尔一起,我是分子动力学兆酶测序仪的第一批客户之一。加文研究所是首批获得HiSeq X Ten系统的三家机构之一。

问:您早期的测序工作如何影响了您目前的研究重点?

CB早些时候,我们看到了感兴趣的基因的多态性和变异。在我的博士论文中,我分析了当时最大的基因组数据集,其中包括在多个个体上测序的25个果蝇基因和在多个植物上测序的15个拟南芥基因。我们正在研究氨基酸的差异以及有益和有害突变的积累。从那一刻起,我开始考虑创建一个大型的人类序列数据集,这样我们就可以用同样的方法来分析它。

SK在国家基因组资源中心,我们使用早期的NGS对转录组进行测序,然后是植物和病原体的基因组,然后开始对人类样本进行测序。我们中的一些人意识到,我们在研究环境中进行的研究很快就会开始影响医疗保健。环顾全国之后,我们三个人搬到了堪萨斯城的儿童慈善医院,建立了第一个儿科基因组医学中心之一,并开始进行转化研究。我现在在Rady儿童基因组医学研究所我们在那里更进一步,专注于在加州最大的儿童医院大规模实施基因组系统医学。

JM高通量测序对人类基因组转录复杂性的评价产生了巨大影响。NGS加速了我们深入研究转录组的能力,使我们能够探索非蛋白质编码转录本的非凡世界,这些转录本在发育过程中以精确的模式在不同的细胞和组织中从基因组中涌出。我现在认为人类基因组是一个非凡的。zip文件。人类基因组的转录复杂性至少比基因组本身复杂一个数量级,它可以以不同的方式被解压缩,编码和非编码rna在不同时间在不同细胞中有不同的表达和剪接模式。如果没有高通量测序,我们就无法探索这个世界。

“在基因组学的新世界里,每个学生、博士后、实验室和院系都需要具备处理和分析大数据的能力。”

问:你现在如何使用NGS ?

CBNGS为种群基因组学开辟了新的途径。我记得在冷泉港的一次会议上,我意识到1000个基因组计划应该包括混合基因组。人们对此提出质疑,但我相信,为了分析和进行跨种族和多种族的研究,我们需要弄清楚如何理解混合基因组。

我们参与临床基因组资源(ClinGen)联盟的原因之一是汇总临床基因检测数据,并消除不确定意义变异(VUS)率,这在某些少数民族群体中较高,仅仅是因为没有那么多的这些序列被分析。NGS使得这些全基因组关联研究(GWAS)的后续研究既便宜又容易。我们发现的每一个氨基酸变化都是确凿的证据。很明显,如果我们真的想开发出造福所有人的基因组医学,我们就需要扩大人类DNA研究中的种族代表性。

SK我们专注于全基因组测序(WGS),因为它是终极的分子测试。WGS也更快,我们已经与Illumina合作开发了一种方法,使我们能够在26小时内解码和分析整个人类基因组。1我们计划在明年年中之前为新生儿和儿科重症监护室(NICU和PICU)的每一个未确诊的儿童提供快速WGS,并进行临床研究,以确定基因组医学在儿科住院和门诊环境中的临床效用和成本效益。

问:HiSeq X系统能让你学习什么?

CB种群测序是我一直想做的事情的顶峰——分析许多人类基因组。我们正在进行大规模的人群测序研究,以它们为基线来回答重要的人群遗传问题,并分析结果,为临床医学提供新的方法。例如,我们正在秘鲁进行一项子痫前期研究,使用大规模基因分型和测序的混合方法,研究海拔适应,因为它与子痫前期有关。

SK使用HiSeq X系统,基因组的成本要低得多,所以我们可以测序更多的三重奏。有8000种已命名的遗传疾病,我们和其他人都强烈地认为,NGS将改变我们识别这些疾病的能力。我们希望使用HiSeq X和Illumina SeqLab基础设施来逐步开发支持这一观点的证据基础。

JM加文研究所是最早将基因组学作为其研究工作中心的研究所之一,而不是传统分子生物学的延伸。随着基因组测序的非凡进步和随之而来的成本降低,利用人群测序并将基因组学置于研究和临床的中心在经济上已经变得可行。

HiSeq X系统是如何使翻译和研究工作相结合的,这是非同寻常的。我们一直在与世界各地的研究人员合作。HiSeq X Ten系统工作得很好。

除了研究单基因疾病外,我们还将群体测序用于癌症、糖尿病、骨质疏松症、免疫疾病、神经退行性和神经精神疾病以及衰老的重大研究项目。作为国际癌症基因组联盟(ICGC)的一部分,我们正在进行癌症分层研究,并使用NGS来破译癌症基因组并评估家族性癌症风险的遗传成分。我们正在对1型糖尿病患者进行测序,以发现那些在生活中表现良好的患者与那些在生活中遭受严重并发症(如肾衰竭)的患者之间的遗传差异。在我们的老龄化研究中,我们正在使用人群测序来研究几千名没有心血管、癌症、认知衰退或神经退行性疾病迹象的老年个体。我们正在开发一个风险耗尽的队列,我们可以用它作为研究患有此类疾病的人群的对照。使用HiSeq X Ten测序能力进行的其他项目是研究患有心脏、线粒体和阿尔茨海默病的人群。

“我们最大的挑战是学习如何共享种群测序数据。”yobet亚洲

问:共享人群测序数据的挑战是什么?

CB我们最大的挑战是学习如何共享种群测序数据。yobet亚洲美国国立卫生研究院和其他组织现在要求研究人员分享他们的数据。不幸的是,临床数据并非如此。大多数医院并没有共享数据的真正宗旨。我们也生活在一个相互联系的世界,这使得患者在分享信息时感到不舒服。在这方面,全球基因组学与健康联盟和其他实体的努力将在制定前瞻性的同意、隐私程序以及数据治理和透明度方面的最佳实践方面发挥重要作用。

SK在雷迪儿童医院进行基因组测序之前,家长们必须知情同意。同意过程的一部分是我们能够公布基因组的协议。我们去识别它,这样就没有信息可以将基因组与孩子或父母联系起来,然后这些信息就可以在国家生物技术信息中心(NCBI)的基因型和表型数据库(dbGaP)上使用,这是一个私人数据库。研究人员只有在向NIH申请并提供他们需要为研究访问这些信息的充分理由后才能获得数据。它似乎在隐私问题和其他研究人员能够研究公共基因组的利益之间提供了一个很好的平衡。

不幸的是,并不是所有的医院都有基因组共享的知情同意程序。临床研究人员需要人类全基因组序列信息作为基准。他们想知道基因变异在基因组中有多普遍。获得准确变异信息的唯一方法是获得数十万个基因组,这样我们就可以评估我们看到的每一个变异的频率。

问:整合WGS、表观基因组、转录组和其他基因组和表型数据以获得不同的基因组快照的价值是什么?

CB在执行各种组学分析,RNA-Seq,甲基组测序等方面具有重要价值。我们仍然不了解人体的调节网络。我们今天是否执行和整合组学数据?我认为这发生得很慢,部分原因是测序比解释要容易得多。

SKpanomics绝对有价值,我们将全基因组数据与深层表型、表观遗传学、基因表达、代谢组学和蛋白质组学数据结合在一起。基因组测序并不是游戏的结束,但它是一个很好的开始。我们开始明白我们需要什么来提供精准医疗。例如,我们不知道我们在基因组中看到的大多数变异在功能上意味着什么。因此,我们无法自信地评估它们是否能改变一个人。很明显,我们需要更多类型的数据来进行大规模的评估。

JM未来的临床研究和医学将围绕大数据集的整合展开。这不仅仅是个体和合并的基因组数据集。越来越多地,这些将与转录组、表观基因组、蛋白质组和最重要的表型数据合并,以创建高度连接的、信息丰富的数据集。医学正在迅速走向大数据,获得数万乃至数十万个基因组序列将加速这一进程。这将改变一切。

“全基因组学肯定有价值,我们将全基因组数据与深层表型、表观遗传、基因表达、代谢组学和蛋白质组学数据结合在一起。”

问:生物信息学和数据库在获得种群测序的全部价值方面有多重要?

CB从一开始,很明显,我们必须将测序与分析工具结合起来,才能理解所有的数据。通过连接和分析表型和基因型信息,我们可以开始揭示从静态数据中看不到的模式。有一种乐观的看法是,如果我们以更严格的方式测量表型和暴露,我们可以收集大量的数据来帮助我们确定遗传关联。

JM我认为生物信息学框架和数据库是整个努力的核心。它将整合基因组数据与正交数据集,以提取有价值的信息。我们确定的遗传模式将有助于告知临床中的个人情况,并通过元数据分析,整个卫生系统的疾病模式,共病等。

人口测序不适合胆小的人。在过去的1-2年里,我们已经投入了大约1000万美元来构建计算管道。我们有一个不断壮大的60人团队,致力于整个组装管道,执行测序,组装数据,调用种群间的变异和变异差异,并将数据与表型数据连接起来。

在基因组学的新世界里,每个学生、博士后、实验室和部门都需要有处理和分析大数据的能力。这不是走廊尽头的专家能做的事。它是整个研究和医学的核心。这是一个数据驱动的世界,我们正在进入这个世界。

SK我们在最近的一项研究中认识到生物信息学的价值,该研究比较了WGS和传统基因检测在识别危重新生儿孟德尔疾病方面的有效性。2为了分析这些数据,我们开发了几种新的生物信息学工具。这篇论文证明了基因组测序的有用性,但我们需要进一步的证据来证明基因组学的临床价值。我们还需要一种简化的方法来通知临床医生结果,不仅用于诊断,还用于NGS数据如何为治疗决策提供信息。

问:需要什么样的数据库?

JM我们需要国家一级的基因型/表型相关数据库,由卫生当局维护,并可由经过认证的研究人员和临床医生查询。它们必须是国家数据库,因为每个司法管辖区都有特殊的法律和其他上下文要求。它们需要以某种方式连接到一个全球数据库中,以便在一个国家产生的数据可以在其他地方使用,并以多维方式进行探索,以促进我们对人类生物学和疾病的理解。

“我认为最广泛意义上的人口规模测序将从儿童开始,可能在出生时取代目前的格思里测试。”

问:创建这些数据库需要多长时间?

JM我们不可能在一夜之间给世界上的每个人测序,但我相信在十年内我们将拥有大型基因组数据库。基因组数据将越来越多地成为医疗记录的标准部分。理想情况下,我们将在云端拥有精心策划的、以证据为基础的基因型/表型相关数据库,这些数据库将得到维护,并不断更新国家资源。

最初的用途将是对患有严重遗传残疾的个体进行测序,因为我们可以很快地诊断出大约一半此类病例的致病突变。癌症分层将是一个重要的领域,使医生能够确定疾病的分子基础,从而更有效地治疗疾病。第三个领域将是检测药物不良反应的遗传标记,因为这对每个国家的医院系统都是一个巨大的负担。我们将能够通过基因组信息预测和避免这些不良反应的高比例。

我们建议澳大利亚卫生系统将所有发育障碍和/或智力障碍患者作为一线诊断。我预计这将在未来2-5年内成为惯例。我认为最广泛意义上的人口规模测序将从儿童开始,可能在出生时取代目前的格思里测试。下一代孩子将是基因组一代,随着技术和信息价值的提高,基因组测序和分析将有选择性地应用,然后更广泛地应用。

问:你认为WGS会成为一种常规临床测试吗?

JM我们很快就能将测序作为常规医学检查的一部分。测序的成本将继续下降,从而可以进行再分析,以提高某人的主基因组数据的准确性,合并表观基因组和转录组数据,或查看体细胞变异。随着我们获得更多关于基因组变异在生物学和医学上的意义的信息,测序的价值将会上升。目前,测序在医学领域的更高应用受到了信息分析背后数据库的丰富性和质量的限制。

值得注意的是,美国医学遗传学家学会(ACMG)要求报告56种基因,因为这对患者未来的健康有重大影响。我们将开始看到经过良好验证的基因集合,这些基因要么被要求报告,要么在这一领域工作的组织将有信心向临床医生和患者报告,随着时间的推移,列表将不断扩大。

SK我们有一个丰富的新生儿筛查项目的传统,每个婴儿在出生时都有一个脚后跟测试棒,用于测试29种情况。美国各地的几个研究小组正开始研究,如果我们能用基因组测序取代鞋跟,还能提供哪些额外的信息。我们还不知道。

“群体测序将使我们能够发现和描述涉及不良反应的临床可操作变异的全球等位基因频率。”

问:人类全基因组数据是否已经让我们更接近个性化医疗?

CB我认为基因组测序最终将成为日常护理的一部分,成为人们电子健康记录的组成部分。这是一个有趣的时期,因为我们正处于一个过渡阶段。测序技术已经成熟,人们正在实施高通量测序,很快将常规进行人群测序。

我们需要拿出一个协调一致的计划来汇总这些数据,分析它们,并尽快将它们转化为健康效益。最终,我们需要为公众提供良好的投资回报。

SK在未来,测序结果将为治疗改变提供信息。传统上,诊断领域一直是病理学家和实验室的家,而医疗实施一直是医生和临床医生的角色。在基因组医学领域,这两者将融合在一起。这将是一个挑战,因为双方都不习惯让另一方参与这些任务或信息。

JM我认为问题在于我们对基因组的理解仍然有限。今天,我们只能准确地报告蛋白质编码序列中某些变异的影响。从文献中收集足够的证据和数据,自信地称基因组其他部分的突变或变异可能具有医学意义,这是一项巨大的努力。通过人口测序创建的大型全球数据库将支持这一努力。这些数据库将包含反映一系列突变和表型特征的序列,将使查询能够确定一个新样本是否反映数据库中已经存在的症状和突变。

问:来自人群测序的数据将如何改变医学?

JM人口测序将对医学产生深远影响,使其从危机管理的艺术转变为健康的科学。我们现在知道,个体基因组变异和我们的遗传特质会影响我们目前的健康,并导致未来疾病的风险,无论是2型糖尿病、癌症、类风湿关节炎还是阿尔茨海默病。在许多情况下,预先警告是预先准备的,使临床医生和患者能够实施策略来减少、避免或为这些可能发生的情况做好准备。

SK我研究儿童罕见的遗传疾病,这些疾病在遗传上很简单。我们现在有能力进行快速诊断,因此,第一次,这些疾病可以成为一个具有成本效益的地方来开发和生产药物。我们的希望是,基因组在诊断复杂疾病方面将越来越有价值,就像诊断单基因疾病一样。这需要几十年的时间才能赶上,人口研究在缩小差距方面将非常重要。人口研究中令人兴奋的一件事是,我们开始重新定义我们如何根据基因来描述疾病,而不是根据症状。

JM人群研究将为治疗学的发展提供信息,特别是在确定不良反应的遗传学方面。在美国,每年有10万人死于处方药的不良反应。3.在澳大利亚,至少2-3%的住院患者是由于对处方药的不良反应。4

CB例如,阿巴卡韦(Abacavir)是一种重要的抗艾滋病药物,研究人员已经发现了一种与阿巴卡韦过敏有关的HLA变异。该变异在非洲和欧洲的患病率较低,但在印度和亚洲的某些人群中,该变异的频率为20%。5如果携带该变异的患者服用一次阿巴卡韦,他们就会变得非常虚弱。如果注射两次,他们就会死亡。群体测序将使我们能够发现和描述涉及不良反应的临床可操作变异的全球等位基因频率。瓶颈是如何让医生能够理解药物代谢信息,这样他们就能知道是选择药物A还是药物B,或者是使用一半或两倍剂量的药物。

JM制药公司也开始在过去的药物试验中使用人群测序来识别特殊反应者。如果他们能够对人群进行分层,并确定反应者的特定遗传背景,他们就可以分析所涉及的生化途径。他们不仅拯救了失败的药物,他们还拯救了有效的、可能挽救生命的治疗患者。

“特别是在美国,我们需要对健康状况最差的族裔人群进行人口排序,这样他们在医疗方面的负面差距就不会扩大。”

问:对种族亚种群进行排序有多重要?

CB事实上,我们拥有进行种群测序的技术是非常了不起的。然而,我们需要共同努力,以便继续对种族亚群体进行研究。如果没有这种方法,研究的重点将仍然是对大量同质人群进行测序,比如芬兰人或冰岛人。尽管这些努力很重要,但并不是所有人都能受益。特别是在美国,我们需要对健康状况最差的种族人群进行人口排序,这样他们在医疗方面的负面差距就不会增加。这是一个挑战,因为没有高层倡议来资助这些努力。美国政府的精准医疗计划是一项伟大的努力,但它无法与英国和其他国家所做的相比。尤其是中国,它将基因组学视为其发展计划的主要支柱之一。

问:1000美元的基因组已经或将产生什么影响?

SK好消息是,1000美元的基因组存在于人群测序中。我们在临床护理中需要的是将快速基因组测序的成本降低到1000美元的基因组水平,而这还没有发生。

JM1000美元的基因组是一个实际的和心理上的临界点。它改变了我们对技术的看法以及我们所相信的可能性。它激发了临床和研究工作的整合,以一种我们从未预料到或认为可能实现的方式。人们现在认识到,我们即将从基因组学作为一种研究工具,转变为一种日常临床分析工具。

“最终,智能设备将自动向云端报告基因组信息。它将带我们去我们做梦都没想过的地方。”

问:当你刚成为一名科学家时,你是否相信有一天人类全基因组测序可以在一天内完成?

CB我会说这是不可能的。疯狂的说话!

SK绝对不是。即使你把我带回到我第一次用Solexa系统测序的时候,我也无法预料到我们会这么快地大量生产基因组。

JM我做梦也想不到。在20世纪下半叶,我们刚刚开始了解DNA是什么样子,基因是什么样子,并开发了原始的基因组分析工具。当时,我们所做的一切都被认为是领先的,事实也的确如此。现在我们正以曲速前进。21世纪将是生物和医学的世纪。NGS与大数据的整合仍在进行中,并将在可预见的未来实现。最终,智能设备将自动向云端报告基因组信息。它会带我们去我们做梦都没想过的地方。这是一个美妙而令人兴奋的时刻。我们很感激像Illumina这样的公司在技术上处于领先地位。

yobet亚洲亚博官网人口了解更多关于本文中提到的Illumina系统:

HiSeq X系列,www.169o.com/systems/hiseq-x-sequencing-system/illumina-seqlab.html

参考文献
  1. Miller NA, Farrow EG, Gibson M,等。一个26小时的高灵敏度全基因组测序系统,用于遗传疾病的紧急管理基因组医学.2015;7(1) 100。做:10.1186 / s13073 - 015 - 0221 - 8。
  2. 威利格LK, Petrikin JE, Saunders CJ,等。全基因组测序鉴定危重婴儿孟德尔疾病:诊断和临床发现的回顾性分析《柳叶刀呼吸医学》.2015;3(5): 377 - 387。
  3. 可预防的药物不良反应:关注药物相互作用。美国食品和药物管理局。www.fda.gov /药品/ DevelopmentApprovalProcess / DevelopmentResources / DrugInteractionsLabeling / ucm110632.htm.2016年5月16日访问。
  4. Roughead L, Semple S, Rosenfield E.文献综述:澳大利亚的药物安全。www.safetyandquality.gov.au wp-content /上传/ 2014/02 /文学-评估-药物-安全- - - - - - -澳大利亚- 2013. - pdf.2013年8月出版。2016年5月16日访问。
  5. 普萨纳基特,布努普拉达,科萨拉拉克萨,等。泰国和柬埔寨艾滋病毒感染儿童中人类白细胞抗原B*5701的流行率:对阿巴卡韦使用的影响儿科感染病学.2013;32(3): 252 - 253。