客户面试

全球临床研究证明了基于泛基因组学的药物发现方法的价值

综合成像、多组学技术和大数据为常见慢性疾病揭示了新的诊断和治疗靶点。

全球临床研究证明了基于泛基因组学的药物发现方法的价值

全球临床研究证明了基于泛基因组学的药物发现方法的价值

简介

Szilard Voros医学博士在弗吉尼亚大学心脏病学培训期间对药物研发和创业创新产生了兴趣。他当时正在研究心血管成像,以支持ezetimibe的开发,这是一种一流的降胆固醇药物。沃罗斯博士后来搬到了佐治亚州亚特兰大市的皮埃蒙特心脏研究所(Piedmont Heart Institute),在那里,他和他的团队开发了新的方法来成像和测量不同器官内的疾病过程。他们很快启动了单独的项目,将成像技术与基因组学、蛋白质组学和代谢组学结合起来,这是一种多组学方法,他们现在称其为泛基因组学。

2011年初,沃罗斯博士清楚地认识到,整合所有这些数据可以显著改善药物发现和开发过程,以及生物标志物的发现和开发。它还可以为医生提供信息,以了解患者的疾病过程状态,并为最有效的预防和治疗提供信息。他创立了全球基因组学集团(G3),并开始在一项开创性的国际临床研究中证明他的泛基因组学方法的潜力,该研究恰如其分地命名为“遗传位点和动脉粥样硬化病变的负担”(Global)研究。

7年时间里,在7000多个临床实验对象和数万亿的数据点之后,沃罗斯博士被证明是一个走在时代前面的远见者。G3成功地将成像、基因组学和数据分析集成到一个强大的药物发现引擎中。该公司已经证明了其新方法的价值,推出了一种新的诊断方法,并与制药合作伙伴开发了几种候选药物。亚博下载app

iccommunity与Voros博士讨论了G3团队如何开发和调整其泛基因组学方法,由此产生的诊断和治疗项目,以及Illumina产品和系统如何为其成功做出贡献。

Szilard Voros是G3的创始人兼首席执行官。

问:你为什么开始做G3?

西拉德:(SV):G3的灵感部分来自于我作为一名执业医生的挫败感。我在做一个预防心脏病的项目,给病人看病,实践循证的、以指导方针为导向的医学,专注于人群而不是个人。这是令人沮丧的。我没有感觉到我对很多病人的生活质量产生了积极的影响。那是21世纪了,我觉得一定有更好的办法。

在我早期的学术生涯中,我们开发了新的成像方法和技术,以支持新型心血管药物的识别。它们本质上是表现型工具,提供了具体和定量的方法来识别和测量疾病的不同方面。我创立了这家公司,并开始研究如何将成像数据与基因组学数据整合起来,并使用高级分析技术对其进行分析。

问:在创造G3的过程中你遇到了什么挑战?

SV:这是一项艰巨的任务。我们的想法是把所有不同的组学技术整合到一个公司,作为一个项目,为一个单一的目标。在那个时候,这个领域是非常封闭的。有基因组学、蛋白质组学、代谢组学和宏基因组学公司,但他们说的不是同一种语言。没有人尝试过整合这些数据集。从概念上、科学上和信息上来说,没有办法把所有的信息都转化成一个通用的词汇。

问:在建立过程中最大的未知是什么?

SV:最大的未知是我们将如何以信息的方式集成数据。我们发现,解决方案是以并行、协同的方式使用不同的方法。例如,我们将全基因组关联研究(GWAS)与定量性状位点(QTL)分析结合起来,将孟德尔随机化与贝叶斯网络分析结合起来。这是一种根据分析目标而变化的集成方法。

图1:G3使用全组学方法,捕获并分析成像、基因组学、转录组学、甲基组学、蛋白质组学和代谢组学/脂质组学数据,GLOBAL临床研究中每个受试者的数据总计高达数十亿个数据点。

问:你们的研究重点是什么疾病?

SV:我们专注于多因素、多基因的常见慢性疾病,如心血管疾病、脂肪肝疾病、糖尿病、骨质疏松症和肥胖。这些疾病对人类寿命有直接影响。我们正在使用我们的方法来理解、研究和影响这些疾病的进程。

问:什么是G3方法?

SV:我们的方法基于三个基本支柱。第一个支柱是通过成像来量化疾病的不同方面的深度表型。第二个支柱是泛谱分析,我们分析血液样本中的DNA、RNA、蛋白质、脂类和其他小分子。第三个支柱是利用系统生物学驱动的生物信息学整合深层表型和整体组学数据。临床研究的数据分析步骤包括整合每个受试者的数十亿数据点。目标是翻译和理解数据,为新的诊断和治疗的发展提供信息。亚博下载app

"...我们从基因组数据开始,通过基因表达、蛋白质组学、脂质组学、代谢组学和其他组学来填补空白。”

问:您为什么对这些样本进行如此多的测序和组学研究?

SV:我们想要解决缺少遗传的问题。当我们在2011年成立这家公司时,有关于心血管疾病的双胞胎研究表明,大约一半的疾病风险是由遗传和遗传因素引起的,大约一半是由环境造成的。1我们还知道,与疾病相关的变异不能解释超过5-7%的心血管疾病表型。此外,97%与疾病相关的snp都没有在外显子中找到,外显子是被翻译成蛋白质的基因组区域。2我们开始思考如何填补这些空白,找到多因子疾病中缺失的遗传性。

我们意识到,虽然基因变异可能会增加某人患病的几率,但它们并不能反映出随着时间的推移,体内发生了什么。这就是为什么我们从基因组数据开始,用基因表达、蛋白质组学、脂质组学、代谢组学和其他组学来填补空白。这是公司的基本理念。

问:您为什么决定进行如此大规模和雄心勃勃的临床研究?

SV:我们意识到,如果我们想要改变基于大数据的药物和生物标志物发现,我们必须在大型临床研究中演示这种方法。2013年,我们开始注册我们的GLOBAL study,这是一项雄心勃勃的努力,旨在前瞻性地从全球患者人群中收集样本。我们知道,这项研究必须是大规模的,需要统计力量来获得有用的数据。根据我们的计算,样本量在6500-7000之间。我们最终在三大洲九个国家的48个临床站点登记了7700-7800名患者。我们相信这是为药物和生物标志物发现的特定目的收集多组学数据的最大和最全面的前瞻性研究。

问:一项8000名受试者的临床试验如何具有检测变异关联的统计能力?

SV:我们正在分层进行组学测量,以了解每个变体的功能含义。因为这些生物通路相互衔接,我们就可以减少研究对象的数量,以达到检测关联的统计能力。

问:临床研究的现状如何?

SV:我们在2014年年中完成了GLOBAL临床研究的注册。我们已经对数千人的每个基因进行了测序,并测量了同一受试者中数十万个中间的生物标记。我们有了所有的原始数据、图像和血液样本,组学分析已经进行了一半。理论上,我们将能够验证任何目标,任何疾病,只要我们有表型信息。在接下来的几年里,我们将研究这些数据,并确定我们感兴趣的常见慢性疾病的靶点。

“贝叶斯分析揭示了聚合在同一生物途径上的层次泛网络……基因变异驱动网络,其次是RNA和蛋白质网络。”

问:你分析了多少数据点?

SV:在成像方面,我们对胸部、心脏和上腹部进行了CAT扫描,有对比和没有对比。我们对每个血液样本进行全基因组测序(WGS),用RNA-Seq和microRNA分析评估转录事件,并用DNA甲基化分析研究表观遗传学。我们还进行了蛋白质组学、脂质组学和代谢组学研究,以评估小分子。试验中的每个受试者总共有数十亿个数据点(图1)。

问:考虑到对每个血液样本进行的分析数量,你们如何确保数据质量?

SV:从一开始,我们就觉得在收集级别确保数据质量很重要。我们非常注意如何处理这些样品。抽血后,血液被旋转并分离成47份等份,在放血后70分钟内冷藏。我们把等分的样品分成A和B两部分,然后在不同的日子,用不同的卡车或飞机运往不同的州,以达到灾难恢复的目的。

当我们的生物库中有血液样本时,一流的服务提供商会执行不同的组学分析,包括用于WGS的Illumina测序服务和用于RNA-Seq、miRNA-Seq、DNA甲基化、蛋白质、脂质和小分子/代谢物分析的表达分析/IQVIA服务。

问:你有什么科学观察?

SV:我们已经做了大量的科学观察,但在最高水平上,有两个主要的见解。第一个发现了函数收敛,验证了我们的概念。在我们早期的一项分析中,我们在数百名患者中获得了一万亿个数据点,并寻找导致心血管疾病、非酒精性脂肪性肝炎(NASH)和骨质疏松症的途径。贝叶斯分析揭示了聚合在同一生物途径上的层次泛网络。它们就像我们所期望的那样,基于生物学的教条,基因变异驱动网络,然后是RNA和蛋白质网络。我们还重新发现了已知的途径,包括LDL途径,这是最著名的心血管疾病途径之一。

我们的第二个观察结果更模糊一些。我们在基因组中寻找每个“组学”数据集中针对每种疾病状态的最热门或最强关联。我们不是在基因组中随机分布的,而是在集群中发现的。我们开始从科学上确定这两者的相关性。

"...从转录组数据中找到了一个潜在的靶点。然后,我们能够使用WGS数据,并基于LOF变体对目标进行遗传验证。”

问:您是否利用您的总体经济学方法找到了具有商业潜力的新目标?

SV:我们获得了心血管疾病诊断生物标记的专利。它来源于质谱驱动的代谢组学数据。这是一种非常简单的血液测试,可以作为压力测试的看门人,用于那些因胸痛而来看医生的病人。

在与一家大型制药公司的合作下,我们成功地确定了另一个目标。无偏贝叶斯网络分析从转录组数据中确定了一个潜在的靶点。然后,我们能够使用WGS数据,并基于功能缺失(LOF)变体对目标进行遗传验证。我们的制药合作伙伴确认了NASH靶点在体外设置。

我们还发现了心血管和脂肪肝疾病的一个新的生物途径和药物靶点。该途径是两种疾病途径的交集。我们正在开发一种基于这个靶点的药物。事实是,我们用我们的基因组学方法重新发现了已知的途径,这让我们对这个方法和我们已经发现的其他几个新途径的有效性有信心。

令人惊讶的是,这些发现都是基于我们分析的前几千个研究对象的数据。我们甚至还没有接触到所有数据的表面。

问:全局方法能否为药物开发引入新概念?

SV:全局方法加快了目前识别和验证遗传变异的时间和成本密集型过程。例如,GWAS发现了与冠状动脉钙化(CAD)事件风险增加相关的染色体9p21位点。3.研究人员花了近15年的时间来了解这些变体的功能方面。心血管疾病的最新治疗方法之一是针对PCSK9蛋白酶。最初的观察是对大约7000-9000名患者进行的,并花了许多年的时间来确定目标。

我们的方法通过两种方式加速了对变体功能结果的识别。首先,我们使用WGS来查看每个变体。与依赖于先前识别的变异的基因分型方法不同,我们使用WGS发现的变异是基于我们自己数据集中的病例和对照的差异。我们不会因以前的研究而产生偏见。事实上,我们为一些新目标识别的一些重要变异就是通过这种方式发现的。

其次,我们正在进行一些组学测量,以了解该变体的功能含义。我们引入了组学定量性状位点(oQTL)的概念,对单个变体的基因表达、microRNAs、蛋白质、脂质和代谢物进行定量分析。有了这些数据,我们可以从几百个病人身上获得同样的见解。例如,在收集数据集并在< 500例患者中以高统计显著水平完成验证后的几个月内,我们就确定了NASH目标。

临床研究是药物开发的一项重要的财政投资。我们相信我们的全域方法可以减少开发新疗法所需的资金。

“我们相信,精确的WGS比基因分型和全外显子组测序提供了显著的增量价值。”

问:在总体经济学方法中,WGS的价值是什么?

SV:我们主要使用WGS进行遗传目标验证。然而,我们通常能够从蛋白质组学或基因表达研究生成的功能非dna数据中识别潜在靶点。为了验证这一点,我们查看了WGS数据,并查看了编码该蛋白质或受体的基因。然后我们识别该基因中的变异,并寻找与该疾病的生物标志物和表型相关的LOF变异。我们在确定NASH目标时使用了这种方法。

问:你是如何选择组学分析伙伴的?

SV:当我们成立G3时,我们有两个选择。一种是购买所有的设备,在我们自己的实验室进行组学测量,或者把一切都外包给一流的供应商。在我们完成尽职调查后,很明显,正确的答案是外包。

我们选择了Illumina FastTrack测序服务作为我们的WGS服务提供商。在我之前的学术生涯中,我使用iScan系统和Infinium基因分型阵列对心血管疾病进行GWAS。我知道Illumina的产品是可靠和准确的,公司提供了很好的支持。我们相信精确的WGS比基因分型和全外显子组测序提供了显著的增量价值。

在创建G3之前,我曾成功地使用过Expression Analysis/IQVIA。我们选择它来进行其他组学研究,其中一些是与Illumina的产品。例如,表达分析正在HiSeq 4000系统上执行RNA和microRNA-Seq,并在人类甲基化450K BeadChip上执行DNA甲基化分析。

“总体方法加快了目前识别和验证遗传变异的时间和成本密集型过程。”

问:G3的下一步是什么?

SV:我们很期待未来几年会发生什么。仅仅经过7年的努力,我们的血液测试已经进入市场,一些药物靶点也在研发中。现在我们已经证明了我们的泛基因组学方法在心血管、心脏代谢和肝脏疾病中的价值,我们想将其应用于其他疾病状态。阿尔茨海默病尤其令人感兴趣。这是一种多因子、多基因的常见慢性疾病,需要定量精确的表型分型,并结合我们的基因组学方法。我们正在寻找合作伙伴来研究阿尔茨海默氏症和其他痴呆症。我们希望采用同样的方法,并将其应用于神经退行性和肌肉骨骼疾病。我们最终也想在肿瘤学领域启动项目。

问:G3方法对医疗保健有何影响?

SV:20世纪90年代和21世纪初是一个以人口为基础、以指导方针为驱动的医学时代。我们希望我们的方法在过渡到分子剖面驱动的,个性化的方法是有用的。我们的愿景是,未来当医生走进检查室时,我们的方法将使他们能够查看病人的资料和分子指纹,并为坐在他们对面的病人开出个性化的治疗处方。

yobet亚洲亚博官网人口了解G3是如何将所有组学结合在一起的:

G3视频

yobet亚洲亚博官网人口了解更多关于本文中提到的服务、系统和产品的信息:

HiSeq 4000系统

iScan系统

甲基化芯片

Illumina FastTrack测序服务

参考文献
  1. Marenberg ME, Risch N, Berkman LF,等。一项双胞胎冠心病死亡的遗传易感性研究N英语J医学。1994;330:1041 - 1046。
  2. 莫拉诺,亨伯特,莱恩斯,等。调控DNA中常见疾病相关变异的系统定位科学.2012;337:1190 - 1195。
  3. McPherson R, Pertsemlidis A, Kavaslar N,等。第9号染色体上与冠心病相关的普通等位基因。科学。2007; 316:1488 - 1491。