客户访谈

用LipidSeq寻找血脂异常变异

Robarts研究所的研究人员设计了一个定制的靶向重测序面板,用于分析脂质相关的遗传变异。

用LipidSeq寻找血脂异常变异

寻找血脂异常变异

介绍

心血管疾病是北美人死亡的主要原因之一。1.有许多遗传疾病和突变使人们易患心血管疾病的危险因素,如高胆固醇、高血压和糖尿病。许多这些遗传缺陷涉及脂质代谢和血脂水平的调节。识别这些遗传变异可以促进患者干预,并增加对潜在疾病的分子生物学的理解。

传统上,遗传变异是通过毛细管电泳(CE)/Sanger测序鉴定的。然而,这个迭代过程是耗时和劳动密集型的。新技术,如下一代测序(NGS),使科学家能够扩大他们的研究范围,缩短发现的道路。

20多年来,加拿大安大略省伦敦罗巴特研究所布莱克本心血管遗传学实验室主任、医学博士罗伯特·赫格尔一直使用桑格测序技术研究与血脂异常和相关代谢紊乱相关的遗传变异。2013年,他的团队通过MiSeq转向了NGS系统和Nextera快速捕获富集。iCommunity与研究经理约翰·罗宾逊(John Robinson)讨论了他们针对LipidSeq的重新测序小组的开发,以及他们如何使用该小组发现新的变体。

约翰·罗宾逊(John Robinson)是加拿大安大略省伦敦罗伯特研究所罗伯特·黑格尔(Robert Hegele)博士实验室的研究经理。

问:你什么时候开始参与脂质研究的?

约翰·罗宾逊(小):我在罗伯特研究所工作了22年,和我们的主任罗伯·黑格尔博士一起工作了12年。Hegele博士是一名内分泌学家,专门研究脂质疾病,如人类血脂异常和脂肪营养不良。

问:您最初是如何收集有关脂质紊乱潜在致病变量的数据的?

JR:黑格尔博士在我们的仓库里有将近一万两千种不同的人类DNA样本。典型的流程流程始于Hegele医生在他的诊所里看到一个血脂水平异常的病人。在患者同意成为研究对象并签署知情同意书后,我们获取样本。我们实验室的工作人员根据患者的临床诊断、血脂水平和家族史选择候选基因进行调查。

例如,如果有证据表明研究对象可能患有家族性高胆固醇血症,我们将对低密度脂蛋白受体基因(LDLR).我们会选择一个我们怀疑可能含有致病变体的外显子,然后转移到基因中的其他外显子。如果我们没有发现基因突变LDLR基因,我们会转移到脂质级联反应中的下一个基因。每个分析工作流程都是逐个外显子执行的,每次执行1000 bp。有些基因非常大,有40-50个外显子。在我们发现致病变异之前,对每个DNA样本进行Sanger测序可能需要一个月的时间。除了研究时间,还有进行测序、样品制备、PCR等的成本和劳动力。

“大约四年前,我们意识到NGS系统上有重新测序的化学组。我们的实验室工作人员整理了一份我们想要的基因的愿望清单。”

问:什么推动了你的决定转向基于NGS的目标重大恢复?

JR:大约四年前,我们意识到NGS系统上有重新测序小组化学试剂。我们的实验室工作人员(包括博士生、研究助理、技术人员和黑格尔博士)整理了一份我们希望在测序小组上看到的基因愿望清单。

我们想到了由几个层次组成的面板内容。第一层是标准的单基因血脂异常基因,已经相当成熟。这些基因如果发生突变,可能会导致该表型。这第一层基因包括升高的低密度脂蛋白胆固醇(LDL-C)、高密度脂蛋白胆固醇(HDL-C)和高甘油三酯(TG)表型。这些是黑格尔博士在临床上看到的典型表型。

Hegele博士也见过因脂肪营养不良而导致血脂异常的患者,以及遗传性糖尿病,如年轻人的成熟型糖尿病。第二层基因包括与血脂异常的这些次级原因相关的基因。第三层是我们感兴趣和发现的脂类基因。这些是在动物模型中发现的基因,但没有描述人类的基因变异。这三个基因层构成了我们现在称之为LipidSeq的69个基因面板的愿望清单。我们已经发表了相关论文,其中一篇发表在《脂质研究杂志》上。2、3

问:您如何使用面板进行变体发现?

JR:目前,我们每周在一次MiSeq运行中处理24个样本。MiSeq系统生成24对FASTQ文件,然后对其进行对齐、局部重新对齐、移除PCR重复,然后调用变体生成24个VCF文件。VCF文件进行注释,以便我们能够识别可归因于cau的熟悉和新颖变体唱表型。

问:你能识别多基因和单基因变异吗?

JR:是的,我们可以使用LipidSeq面板识别多基因变异。我们还发现了遗传易感性对一个特定性状的另一个维度,称为多基因性状分数。我们使用在已发表的全基因组关联研究(GWAS)中确定的单核苷酸多态性(SNP)靶标,例如一份报告称,研究对象的GWAS SNP有不同的等位基因模式,其中一个等位基因导致该对象的特征被提高。在此之前,我们使用TaqMan方法进行这些实验,我们会检测一个SNP群体。例如,除了几个与高LDL-C相关的基因外,我们还在面板上有10个与高LDL-C相关的GWAS SNP靶点。对于每个SNP靶点,非性状的低密度脂蛋白- c等位基因纯合的受试者得分为0。实验对象的杂合高LDL-C等位基因得分为1分,纯合高LDL-C等位基因得分为2分。对于每一个单独的SNP,受试者可以得到0、1或2分。如果有10个snp组成一个性状,受试者的多基因性状得分可能在0到20之间。然后我们应用一个加权因子。

“桑格对每个DNA样本进行测序可能需要一个月的时间,然后我们才能发现致病变异。除了研究时间,还有成本和劳动力。”

问:在开发LipidSeq面板时,您面临哪些挑战?

JR:这看起来很琐碎,但我们必须学会如何生成一个BED文件,这是一个以yobet亚洲文本文件形式保存的Excel文件,这样我们就可以为LipidSeq面板上的基因的外显子区域设计捕获探针文件。我们过去通过管理加州大学圣克鲁兹分校(UCSC)基因组浏览器的轨迹,手工绘制给定基因的每一个替代亚型的区域。问题是如何得到一个BED文件,该文件将考虑一些转录本的替代异构体。如果我们做得不对,它可能会损害寡聚体准确捕捉DNA的能力。我们还通过设计迭yobet亚洲代了解到,我们必须适应GC内容和重复序列区域,以获得足够的覆盖深度,以作出准确的基因型调用。至关重要的是,BED文件准确地代表了面板上探测器感兴趣的领域。最后,我们创建了为我们组装这些类型的BED文件的脚本。我们正在为LipidSeq面板使用我们设计的第三个版本,并希望在2017年实现第四个版本。

问:使用DesignStudio软件开发Lipidseq面板的方法是什么样的?

JR:在设计LipidSeq面板时,DesignStudio软件很容易使用。在我们设计了BED文件和基于外显子边界的正确碱基对填充后,我们意识到我们的面板由700 kb的编码外显子和SNPs的捕获寡核苷酸组成。然后我们开始利用MiSeq系统的属性。我们研究了样品多路复用和不同的测序试剂盒,以确定我们将获得多少实际读取,从而达到我们将实现的覆盖深度。

问:LipidSeq面板的工作流程是什么?

JR:我们每周加工24个样品,大约有两周的周转时间。将DNA从基因组浓度稀释到5 ng/µl并非小事,但这是可行的,所以需要几天时间才能完成。最初,我们通过Nextera快速捕获自定义富集试剂盒同时运行了12个人类DNA样本。随着MiSeq v3试剂盒的出现,我们现在能够同时运行24个样品。

目前,这是一个为期两周的过程。在第1-3天,我们使用Nextera Rapid Capture定制富集试剂盒运行24个DNA样本,然后在MiSeq系统上以24个倍数对它们进行测序。24对FASTQ文件被交付到我们的服务器,我们使用CLC Genomics Workbench软件批处理这些文件,创建进入注释管道的VCF文件。

“与Sanger测序相比,LipidSeq面板的输出和周转时间甚至无法相提并论。用MiSeq System上的LipidSeq面板对24个样品进行测序,每人可获得700 kb的测序数据。桑格测序每次只能给出1000 bp。”

问:与使用Sanger测序来识别变异相比,MiSeq系统中LipidSeq面板的输出和周转时间如何?

JR:Lipidseq面板与Sanger测序的输出和周转时间甚至不可比较。使用MISEQ系统上的Lipidseq面板测序24个样本,每人提供700 kB的测序数据。在两周内,我们有诸如rarence和致病性的注释和分类的文件,包括单一的单一和多种子型变体。Sanger测序每次运行仅提供1000 BP,这是具有致病变种的外显子的最佳猜测。此外,您必须使用Taqman测定来获得多基因特质分数。

问:MiSeq系统产生的数据质量如何?数据是如何分析的?

JR:MiSeq系统工作得很好,它产生了良好的数据集。我们的生物信息学软件可以同时处理多个批次的样品,并生成高质量的VCF和注释文件。在我们拿到这些文件后,我们会让我们的研究助理管理这些个人数据。最终捕获的70万个核苷酸在VCF文件上减少到约800个核苷酸或支架位置。这800个核苷酸被减少到大约20个候选的有害和罕见的因果关系的各种血脂异常综合征。在这一点上,我们的工作人员正在策划一小部分,然后形成一份报告,黑格尔博士可以与他的研究对象交流。

“MiSeq系统成为了首选平台。客户需要高质量的数据和大量的数据。其他测序技术的周转速度可能更快,但它们无法与MiSeq系统提供的高质量数据竞争。”

问:你如何添加新的基因座到LipidSeq面板?

JR:我们在DesignStudio Software导入格式中创建了一个标准的BED文件,该文件将所有的isoforms和重复探针设计内置于电子表格中。DesignStudio Software从那里接手,把设计交给我。如果出现低覆盖率或GC内容警告,我们通常已经为此复制了探测。我们可以连接到UCSC基因组浏览器,看看探针是什么样子的。

问:当你在研究中使用LipidSeq小组时,有没有什么惊喜?

JR:在一些候选基因中存在不同类型的变异模式和不同的多基因特征评分谱,这取决于我们所观察的表型或表型的极端。它们是我们正在准备的科学手稿的焦点。

LipidSeq面板使我们能够获得迄今为止我们测序的所有2000个研究对象的完整数据集,无论表型如何。VCF文件显示每人有800到1000个变种。这为我们提供了一个机会,从评估个体案例(什么变异导致了受试者的表型)转移到使用序列核心关联测试等工具进行关联测试。因此,我们可以从个体转移到群体和人群,使用NGS进行其他研究人员正在进行的微阵列实验。在我们的例子中,我们使用VCF文件作为主题的变体调用文件。

问:您是否在实验室使用MiSeq系统进行其他研究?

JR:我们让MiSeq系统忙于运行我们实验室的样本。我们是伦敦区域基因组学中心(LRGC)的客户,该中心是黑格尔博士在罗巴特研究所领导的核心实验室。我们的实验室也是安大略省神经变性研究倡议(ONDRI)的核心实验室,安大略省大脑研究所的一部分。MiSeq系统正在使用其ONDRISeq重新测序面板处理样本,该面板旨在识别与神经退行性疾病相关的变体。LRGC的另一个客户开发了基于药物基因组学的面板。LRGC还对许多细菌基因组和tr进行测序编写脚本,并对其MiSeq系统进行微生物组分析。

问:研究人员如何看待MiSeq系统的数据?

JR:他们喜欢能给我们提供DNA和RNA样本,并得到高质量的数据作为回报。例如,我们与LRGC的工作人员合作,建立满足客户需求的实验。他们喜欢MiSeq系统可以对小的细菌基因组和转录组进行测序,可以在一个运行的墨盒中对样本进行多重复制,从而节省资金,并最终为他们提供高质量的数据集。CLC Genomics Workbench软件使他们能够执行不同格式和实验设计的DNA和RNA分析。这些数据集在复杂环境的细菌转录组和微生物组谱的不同条件下产生表达差异。

“LipidSeq小组使我们能够获得迄今为止我们测序的2000个研究对象的完整数据集……因此,我们可以从个人转移到群体和人群,使用NGS进行其他研究人员正在进行的微阵列实验。”

问:是什么让你选择MISEQ系统?

JR:我们是加拿大首批拥有离子激流个人基因组机(PGM)的实验室之一。很明显,我们的PGM输出,我认为一个芯片是500 Mb,而大芯片是1 Gb的理论输出,不匹配MiSeq系统的14 Gb理论输出。MiSeq系统成为了首选平台。客户需要大量高质量的数据。其他测序技术可能有更快的转变,但它们无法与MiSeq系统的高质量数据竞争。

问:您如何选择使用Nextera快速捕获自定义富集试剂盒或TruSeq自定义放大器?

JR:我们在启动过程中就知道Nextera Rapid Capture Custom Enrichment Kit和TruSeq Custom Amplicon。我在几个原理证明设计中发现,TruSeq Custom Amplicon是基于生产PCR扩增设计,这是易受重复元素和GC含量成分的目标区域的问题。如果你在提交TruSeq Custom Amplicon的设计时输入了100%的BED文件坐标,你可能会获得90-95%的设计成功率。相反,如果您将100%的BED文件提交给Nextera Rapid Capture Custom Enrichment,您将获得为该设计100%设计的探头。然后你必须弄清楚在某些地区是否有较差的捕获,如果有,决定如何提高捕获率。使用TruSeq Custom Amplicon,您将永远不会有这样的机会,因为它不会为这些区域设计探头。

我们发现,在我们的LipidSeq研究中,使用Nextera Rapid Capture Custom Enrich是有益的。我们学会了使用碱基对填充,以确保我们在目标区域获得足够的覆盖率。在Nextera Rapid Captyobet亚洲ure Custom Enrich上,我们通常在大多数编码区域实现200–400倍的覆盖率耳鼻喉科目标。

当然,TruSeq定制放大器也有它的位置。例如,我们意识到一个新的基因,并希望在所有2000名受试者中对该基因进行测序。我设计了一个基于TruSeq定制扩增子的单一基因的过程。我意识到我可以进行分析,在MiSeq系统上以96倍的速度一次对其进行测序,这比Sanger对积压的样本进行测序要便宜。

问:你们实验室对从Sanger测序到NGS的转变有什么看法?

JR:我们的一些研究助理和高级职员参与了这一转变,他们看到了这一转变在时间和成本方面的成功。然而,我们的四年级学生和新的研究生已经开始期望在两周的时间内获得700KB的数据。

问:罗伯茨研究所的文化是如何支持设计LipidSeq面板所需的创造力的?

JR:罗伯特研究所的文化为其科学家提供了坚实的基础设施。Hegele博士无疑是他的研究领域的世界领导者,他创造了一个优秀的工作环境和科学项目,吸引了富有创造力的人。它让我们跳出桑格的思维模式,拥抱NGS等新技术。一个完美的例子是将外显子重测序和多基因性状评分的概念在同一重测序分析上进行SNP评分,并将其在LipidSeq面板上变成现实。这是创造力和良好洞察力的结果,结合了Sanger和TaqMan分析工作流程,并利用NGS将它们转化为高通量过程。

yobet亚洲亚博官网人口了解有关本文中提到的Illumina系统的更多信息:

Nextera Rapid Capture Custom Enrichment Kit,
www.169o.com/products/by-type/sequencing-kits/library-prep-kits/nextera-rapid-capture-custom-enrich.html

MiSeq系统,www.169o.com/systems/MiSeq.html

DesignStudio定制分析设计工具,www.169o.com/informatic/research/experimental-Design/DesignStudio.html

TruSeq定制Amplicon面板,
www.169o.com/products/truseq_custom_amplicon.html

目标重新排序,
www.169o.com/techniques/sequencing/dna-sequencing/targeted-resequencing.html

参考
  1. 美国心脏协会。心脏病和中风统计- 201y更新:来自美国心脏协会的报告。循环.2017; 135: e146-e603。
  2. Johansen CT,Dube JB,Loyzer MN,等。LipidSeq:单基因血脂异常的下一代临床再测序小组。脂质Res J.55 2014;(4): 765 - 772。
  3. Hegele RA,Ban先生,Cao H,McIntyre AD,Robinson JF,Wang J.针对单基因血脂异常的下一代测序。柯尔奥平利皮多尔酒店.2015;26(2):103–113.