跳到内容

Cyrius:使用全基因组测序数据准确CYP2D6基因分型

小陈和迈克尔·埃伯利

分享这篇文章

介绍

对于大量临床规定的药物,个体之间的个体之间存在显着变化。对药物代谢的这种变异性的强烈贡献因素是药物代谢酶的遗传组成,因此基因分型编码这些酶(即药代购)是个性化药物的重要组成部分1.细胞色素p450 2d6(CYP2D6)编码最重要的药物代谢酶之一,负责约21%的临床用药的代谢2.这CYP2D6基因是高多态性的,由药物转基因(Pharmvar)联盟(Pharmvar)联盟(Pharmvar)联盟定义了100多种星等位基因3..星等位基因4基因单倍型是由小变异(SNVs和indels)和结构变异(SVs)组合定义的,并对应不同水平的酶活性,即差代谢、中间代谢、正常代谢或超快速代谢5-7

基因分型CYP2D6常见的删除和重复CYP2D6和杂交之间CYP2D6及其伪政儿瘫痪,CYP2D74,8,9.,符合94%的序列相似性,包括近几个近似区域8、10.传统上,CYP2D6基因分型采用基于阵列的平台,如PharmacoScan,或基于聚合酶链反应(PCR)的方法,如TaqMan分析,ddPCR和长链PCR,以低或中通量进行。这些检测的星型等位基因(变异)数量不同,导致不同检测的基因分型结果不同8,11,12..为了检测svv,这些试验或测试平台可能需要补充拷贝数变异(CNV)试验,该试验也可能仅限于检测已知CNV的一个子集4,9.

随着下一代测序的最近进步,现在可以在高吞吐量和临床相关的时间框架中概述整个基因组。这些进展的驱动,许多国家正在承担大规模的人口排序项目13 - 15其中药物基因组学(PGx)测试将大大提高这些努力的临床效用。为了在这些研究中实现PGx,我们开发了一个CYP2D6调用者,Cyrius16.,一个小说的特定于WGSCYP2D6基因分型工具克服了与同源之间的挑战CYP2D6CYP2D7.在这里,我们概述了Cyrius和由WGS启用的PGx应用的未来方向。

CYP2D6Cyrius采用的基因分型方法

读取对准精度降低CYP2D6因为同源性CYP2D7(图1)可以使变体调用具有挑战性和易于错误。Cyrius使用新颖的方法来克服这一挑战,并使用Coriell Sample Na12878(* / * 68 + 3 * 4) 举个例子。首先,Cyrius确定两者的总副本CYP2D6CYP2D7通过计算来自WGS对齐的BAM文件的读取深度来组合使用所有读取的所有读取CYP2D6或者CYP2D7.下一个Cyrius确定完整的数量CYP2D6基因以及基于117个碱基的鉴定杂种基因,这些基因已在其之间证明有所不同CYP2D6CYP2D7在人口中。当拷贝数(CN)的副本数量(CN)识别混合动力车CYP2D6在这些碱基测量基因内的变化。例如,图2B中所示的样品NA12878具有两个完整副本CYP2D6一个是外显子1的来源CYP2D6外显子2-9来自CYP2D7(IE。* 68).下一个Cyrius解析读取对齐以鉴定改变定义星形等位基因的蛋白质的小变体(图2C)。最后,CyRius与SVS和小变体与星等位基因定义相匹配,并产生与所谓的变体一致的基因型。

图1. WGS数据质量CYP2D6 / CYP2D7.地区。
平均映射质量(红线)平均来自1000个基因组项目(1kgp)的2504个样本(1kgp)为每个位置绘制CYP2D6 / CYP2D7.区域(GRCH38)。一个中位过滤器应用于200BP窗口。9个外显子CYP2D6 / CYP2D7.显示为橙色(CYP2D6)和绿色(CYP2D7)盒子。的下游两个2.8kb的重复区域(REP1和REP2)CYP2D6CYP2D7近乎相同,基本不可能。紫色虚线盒表示之间的唯一间隔区域CYP2D7和REP7。两个主要的同源区域内的基因是阴影的粉红色和突出的区域,低定位准确性。
图2. Cyrius工作流程,使用NA12878(* 3 / * 68 + * 4)举个例子。

一个。CN(CYP2D6+CYP2D7)通过计数和建模所有读取的读取来导出CYP2D6或者CYP2D7.直方图显示了标准化的分布CYP2D6+CYP2D71kGP样品在CN2、3、4、5、6和7处有峰值。红色的垂直线代表NA12878的值,对应于CN5,表示一个额外的副本(可能是CYP2D6或混合)。B。SVs是通过检查CNsCYP2D6/CYP2D7差异化基础。外显子用黄色盒子表示。蓝点表示原始CYP2D6CNS,计算为CN(CYP2D6+CYP2D7)乘以CYP2D6支持读出CYP2D6CYP2D7支持阅读。红色金刚石表示基因的CNCYP2D6在3'结束时(可以完成CYP2D6或者CYP2D7-CYP2D6混合),计算为CN(CYP2D6+CYP2D7)减去CN(垫片)。这CYP2D6CN调用每个CYP2D6 / CYP2D7.区分现场和变化CYP2D6基因内的CN表示存在一个杂种。在NA12878,CYP2D6从第2号外显子到第1号外显子,CN从2变为3,表示aCYP2D6-CYP2D7杂交种 (* 68).C。定义蛋白质变化小变异的星等位基因的支持读计数被用来称为每个变异的CN。y轴显示所有查询的小变量位置的读取计数。NA12878中有六种变体,其中g.100C>T被称为两个拷贝(一个拷贝属于* 4.而另一个属于* 68基于星星等位基因定义)。最后,根据检测到的sv和小变异称为星型等位基因。

性能验证

CDC基因检测参考资料计划(GET-RM)的参考样本面板的可用性11,17.,主要药物基因的共识基因型是通过多种基因分型平台获得的,这使得新开发方法的基因分型准确性评估成为可能。我们评估了CYP2D6Cyrius对144个真实性样品进行的呼叫,包括138个RM样本和8个样品,使用PACBIO HIFI序列读取产生真理(两个样品在GET-RM和PACBIO之间重叠)。Cyrius最初在144个真实样品中制作了5个不和谐的呼叫,表现出96.5%的一致性。随后我们能够确定原因并改善Cyrius以正确地调用这5个样品中的4个,达到99.3%的“培训”的一致性(144个样品中的143个)。Cyrius的准确性高于现有的CYP2D6调用者Aldy18.(86.8%)和星顶19.(84.0%)16.

总之,本研究中使用的验证样本证实了我们的CYP2D6在47个不同的单倍型中调用精度,包括40星等位基因以及几种SV结构,例如重复和串联布置,包括*13+*2, *68+*4, *36+*10和*36+*36+*10.这些40星级等位基因在Pharmvar(截至7月2020)中的131型星等位基因中的30.5%,51.7%(共分为60分)的明星等位基因,具有已知功能。将Cyrius应用于1000个基因组项目(1KGP)的样本20.代表五个不同的人群(欧洲人,非洲人,东亚,南亚人和混合美国人)表明,这40个经验证的星等位基因占Pangenomic人口中存在的96%的星级等位基因。

我们接下来评估了Cyrius的孟德尔呼吁在597 1KGP TRIOS中排序数据的一致性。虽然上面对真理基因型的比较允许不同的单倍型相位,但是当多于两份的副本时,孟德利亚一致性检查是更严格检查星形等位基因的相位CYP2D6是礼物。在所有三个家庭成员的572个三人组中,561个(98.1%)是孟德尔一致性。所有不一致的三重奏都可以通过改变阶段来解决——即没有先证者具有双亲都不存在的所谓的星型等位基因。大多数(8/11)不一致的情况下,三人鉴定出两个相同的副本CYP2D6应该和另一个没有拷贝的单倍型在同一个单倍型上吗CYP2D6(例如* Cyrius调用* 1 / * 1与trio-based逐步* 5 / * 1x2).这种孟德尔一致性检查确认了整个系谱的基因型的一致性,但不确定恒星等位基因的准确性。将三种一致性测试与上述对真实基因型进行的准确性测试相结合,可以为Cyrius产生的基因型的总体准确性提供信心。

跨五种种族种群的可行药物发生变种

在西里乌斯所采用的方法可用于解决其他类似的同源性问题,包括另一个药物基因CYP2B6.为了提供更完整的药物替代科学图片,我们已经开发了一种与CPIC的基因型19药代理的额外管道21.A级指引(https://cpicpgx.org/genes-drugs/),遗传信息应用于改变受影响药物的处方。这19个基因包括Cacna1s、cftr、cyp2b6、cyp2c19、cyp2c9、cyp2d6、cyp3a5、cyp4f2、dpyd、g6pd、ifnl3、nudt15、ryr1、slco1b1、tpmt、ugt1a1、vkorc1、hla-aHLA-B.,其中我们使用专门的呼叫者基因型CYP2D6 / CYP2B6.(Cyrius),抗原/ HLA-B(DRAGEN HLA调用者)。将小变异和CNVs转换为星型等位基因和活动分数,使我们能够评估1kGP样本中不同代谢状态的分布,并识别那些需要修改药物处方的基因型。基于这一分析,我们估计,泛基因组群体中99.2%的个体至少有一个具有可操作变异的药物基因(图3),这表明WGS可以为几乎所有健康个体提供有价值的药物遗传信息。

图3。泛基因组群体中每个个体具有可操作变异的药物基因数量的分布。

概括

我们展示了一个新的软件工具,Cyrius,准确基因分型高度复杂CYP2D6地区。在144个验证样本中,我们能够在40个不同的恒星等位基因中确认Cyrius的准确性,这些等位基因大约代表了泛基因组群体中96%的恒星等位基因。有兴趣了解更多关于居里乌斯的读者被鼓励阅读我yobet亚洲们描述这个方法的手稿16..与传统的基因分型分析方法相比,WGS为建立更准确的人群等位基因频率数据库提供了一个很有前景的选择,因为它分析了包括CNVs在内的所有变异,结合合适的软件,能够准确地解析所有已知的等位基因。随着基于wgs的PGx工具和更有针对性的方法(如Cyrius)的不断发展,我们可以帮助加速药物基因组学,并向个性化医学迈进一步。

致谢

我们感谢CDC基因检测参考材料计划(GET-RM),用于产生共识基因型。我们感谢纽约基因组中心和Coriell医学研究所的生成和释放1KGP WGS数据。我们感谢Coauthors Fei Shen,Nina Gonzaludo,Alka Malhotra,Cande Rogert,Ryan Taft和David Bentley。我们感谢Bochao Zhang为Dragen HLA来电者提供。

外部链接

出版物:https://www.nature.com/articles/s41397-020-00205-5.

软件:https://github.com/Illumina/Cyrius

参考
  1. 埃文斯我们,伸展mv。用药物替昔代替昔甙展开个性化药物。自然。2004; 429(6990):464-468。DOI:10.1038 / Nature02626
  2. 周自动送料人细胞色素P450 2D6多态性及其临床意义:第一部分。临床药效。2009; 48(11):689-723。DOI:10.2165 / 11318030-00000000000-00000
  3. Gaedigk A,Ingelman-Sundberg M,Miller Na等。药效学基因变异(PharmVar)联盟:加入人类细胞色素P450 (CYP)等位基因命名数据库。临床药狼。2018; 103(3):399-401。DOI:10.1002 / CPT.910
  4. Nofziger C,Turner AJ,Sangkuhl K,等。Pharmvar Genefocus:CYP2D6。临床药狼。2020; 107(1):154-170。DOI:10.1002 / CPT.1643
  5. Gaedigk A,Simon SD,Pearce Re,Bradford LD,Kennedy MJ,Leeder JS。CYP2D6活动分数:将基因型信息转化为表型的定性测量。临床药狼。2008; 83(2):234-242。DOI:10.1038 / SJ.CLPT.6100406
  6. Gaedigk A,Sangkuhl K,Whirl-Carrillo M,Klein T,Leeder JS。世界群体基因型中CYP2D6表型预测。地中海麝猫。2017; 19(1):69-76。DOI:10.1038 / GIM.2016.80
  7. Caudle ke,sangkuhl k,旋转卡拉里罗m等。标准化CYP2D6基因型以表型翻译:临床药遗传学实施联盟和荷兰药物发生的共识建议。临床翻译sci。2020; 13(1):116-124。DOI:10.1111 / CTS.12692
  8. Nofziger C,Paulmichl M.准确基因分型CYP2D6:不是为了胆小的核心。药物基因组学。2018; 19(13):999-1002。DOI:10.2217 / PGS-2018-0105
  9. 杨Y,Botton Mr,Scott Er,斯科特SA。测序CYP2D6基因:从变异等位基因发现到临床药物发生测试。药物基因组学。2017; 18(7):673-685。DOI:10.2217 / PGS-2017-0033
  10. Gaedigk A.CYP2D6基因分析和解释的复杂性。INT Rev精神病学engl。2013; 25(5): 534 - 553。doi: 10.3109 / 09540261.2013.825581
  11. Pratt VM,Everts Re,Aggarwal P等人。28个药理基因137个基因组DNA参考材料的鉴定:GeT-RM合作项目。J Mol Diage JMD。2016; 18(1): 109 - 123。doi: 10.1016 / j.jmoldx.2015.08.005
  12. Bousman Ca,Jaksa P,Pantelis C.精神病学中商业药物遗传学检测的系统评价:关注CYP2D6和CYP2C19等位基因的覆盖和结果报告。药物发生基因组学。2017; 27(11): 387 - 393。doi: 10.1097 / FPC.0000000000000303
  13. 阿什利ea。精准医疗计划:一个新的国家努力。贾马。2015; 313(21): 2119 - 2120。doi: 10.1001 / jama.2015.3595
  14. 荷兰联盟的基因组,Francioli LC,Menelaou A等人。荷兰人口的全基因组序列变异,人口结构和人口统计史。NAT Genet。2014; 46(8):818-825。DOI:10.1038 / NG.3021
  15. Turnbull C, Scott RH, Thomas E等。100 000个基因组项目:将全基因组测序与NHS带来。BMJ。2018; 361:K1687。DOI:10.1136 / bmj.k1687
  16. 陈X,沉F,Gonzaludo n,等。Cyrius:使用全基因组测序数据准确的CYP2D6基因分型。药物基因组学J。在线发布于2021年1月18日:1-11。DOI:10.1038 / S41397-020-00205-5
  17. Gaedigk A,Turner A,Everts Re,等。CYP2D6等位基因遗传检测参考材料的特征:GET-RM协作项目。J Mol Diage JMD。发表于2019年8月9日在线。Doi:10.1016 / J.Jmoldx.2019.06.007
  18. numanagići,malikićs,ford m等。高多态性和结构变体基因的等位基因分解与精确基因分型。NAT Communce。2018; 9(1):1-11。DOI:10.1038 / s41467-018-03273-1
  19. Lee S, Wheeler MM, Patterson K,等。Stargazer:使用CYP2D6作为模型,从下一代测序数据调用星等位基因的软件工具。地中海麝猫。2019; 21(2):361。DOI:10.1038 / s41436-018-0054-0
  20. 1000个基因组项目联盟。人类基因变异的全球参考。自然。2015; 526(7571):68-74。DOI:10.1038 / Nature15393
  21. relling mv,klein te。CPIC:临床药物发生的药物研究网络的实施联盟。临床药狼。2011; 89(3):464-467。DOI:10.1038 / CLPT.2010.279