客户采访

用LipidSeq寻找血脂异常变异

罗伯茨研究所的研究人员设计了一个定制的定向重测序面板来分析脂质相关的基因变异。

用LipidSeq寻找血脂异常变异“src=

寻求渗透血症变种

介绍

心血管疾病是北美人死亡的主要原因之一。1有许多遗传疾病和突变使人们倾向于心血管疾病的危险因素,例如高胆固醇,高血压和糖尿病。许多这些遗传缺陷涉及脂质代谢和血脂水平的调节。这种遗传变异的鉴定可以促进患者干预并增加对潜在疾病的分子生物学的理解。

传统上,遗传变异是通过毛细管电泳(CE)/桑格测序确定的。然而,这个迭代过程非常耗时和劳动密集。新技术,如下一代测序(NGS),使科学家能够扩大他们的研究范围,缩短发现的路径。

在加拿大安大略省的伦敦伦敦罗伯文血管遗传学实验室罗伯特哈格勒(Robert Hegele)罗伯特Hegele,MD,加拿大伦敦,加拿大研究了遗传变异,使用Sanger测序研究了与血液血磷和相关的代谢障碍相关的遗传变异。2013年,他的团队与Miseq过渡到NGS系统和Nextera.快速捕获丰富。icommunity与研究经理John Robinson有关他们的Lipidseq目标Resequencing小组的发展以及他们如何使用它来发现新的变体。

约翰·罗宾逊(John Robinson)是加拿大安大略省伦敦罗伯特·黑格莱(Robert Hegele)博士实验室的研究经理。

问:您是什么时候开始参与脂质研究的?

约翰罗宾逊(JR):我在Robarts研究所工作了大约22年,并与我们的董事罗伯希尔博士,超过12年。Hegele博士是一名内分泌学家,专门从事脂质疾病,例如人类血脂和脂肪蓄水剂。

问:您最初是如何收集有关脂质疾病潜在致病变异的数据的?

JR:Hegele博士在我们的存储库中近12,000个不同的人类DNA样本。典型的过程工作流程从Hegele博士在他的临床中看到患者,血脂水平异常。患者同意成为研究主题并签署知情同意书后,我们获得了一个样本。根据他们的临床诊断,脂质水平和家族史,我们的实验室员工选择候选基因来调查。

例如,如果有证据表明研究受试者可能具有家族性高胆固醇血症,我们将序列低密度脂蛋白受体基因(LDLR.).我们会选择一个外显子,我们怀疑它可能包含致病变异,然后转移到基因中的其他外显子。如果我们没有在LDLR.基因,我们会转移到脂质级联中的下一个基因。每一个分析工作流程都是一个外显子一个外显子地执行,每次执行1000 bp。有些基因非常大,有40-50个外显子。桑格可能要花一个月的时间对每个DNA样本进行测序才能找到致病变异。除了研究时间外,还有测序、样品制备、PCR等的成本和人工。

“大约四年前,我们意识到,在NGS系统上有重新开放的面板化学物质。我们的实验室员工汇总了我们想要的基因名单。”

问:是什么促使你决定转向基于ngs的重测序?

JR:大约四年前,我们意识到在NGS系统上可以使用重测序面板化学。我们的实验室工作人员(包括博士生、研究助理、技术人员和Hegele博士)整理了一张我们希望在测序面板上看到的基因的愿望清单。

我们想到了由几个层组成的面板内容。第一层是已经相当建立的规范单一的血脂血症基因。这些是基因,如果突变可能导致表型。第一层基因包括升高的低密度脂蛋白胆固醇(LDL-C),高密度脂蛋白胆固醇(HDL-C)和高甘油三酯(TG)表型。这些通常是Hegele博士在临床中看到的表型。

Hegele医生还诊治过因脂肪代谢不良而导致血脂异常的患者,以及遗传性糖尿病,如年轻人的成熟型糖尿病。基因面板的第二层包括与这些血脂异常的继发原因相关的基因。第三层是我们感兴趣和发现的脂质基因。这些基因是在动物模型中发现的,但在人类模型中还没有发现基因变异。这三个基因层组成了69个基因面板的愿望清单,我们现在称之为LipidSeq。我们已经发表了相关论文,其中一篇发表在《脂质研究杂志》上。2,3

问:您如何使用Foriant Discovery面板?

JR:目前,我们每周在一次MiSeq运行中处理24个样品。MiSeq系统产生24对FASTQ文件,然后对齐,局部重新对齐,删除PCR副本,然后调用变体产生24个VCF文件。VCF文件被注释,这样我们就可以确定熟悉的和新的变异,可以归因于导致表型。

问:你能识别多基因和单基因变异吗?

JR:是的,我们可以使用Lipidseq面板识别多基因变体。我们确定了对特定性状的遗传易感性的另一个维度,称为多基因特征。我们使用在发表的基因组 - 宽协会研究(GWAs)中鉴定的单一核苷酸多态性(SNP)靶标,例如研究受试者中的GWAS SNP具有不同的等位基因模式,其中一个等位基因导致特征在这个主题中提出。以前,我们执行了使用Taqman测定的人,我们将对一个SNP进行分析。例如,除了与LDL-C相关联的面板上的几个基因之外,我们还在与LDL-C升高的面板上具有10个GWAS SNP靶标。对于每个SNP靶,对于举出LDL-C等位基因的非足够的纯合的受试者将获得0.对象将获得杂合高LDL-C等位基因的1,以及纯合高LDL-C等位基因的2。对于每个单独的SNP,受试者可以得分为0,1或2.如果有10个占构成特征的SNP,则受试者可以在0到20之间的多基因特征分数。然后,我们将应用加权因子。

“在我们发现致病变种之前,它可能需要一个月才能缩短每个单独的DNA样本。除了研究时间,还有成本和劳动力。”

问:您在开发LipidSeq面板时遇到了哪些挑战?

JR:它似乎琐碎,但我们必须学习如何生成一个臭名文件,它是保存为文本文yobet亚洲件的Excel文件,以便我们可以为Lipidseq面板上的基因的外显子区域设计捕获探测文件。我们习惯于通过加利福尼亚大学Santa Cruz(UCSC)基因组浏览器的轨道来映射给定基因的每一个替代类别的区域。问题是如何获得床文件,该文件将考虑一些成绩单的替代异构型。如果我们没有正确做到,它可能会损害寡核苷酸准确捕获DNA的能力。我们还通过设计迭yobet亚洲代学会了,我们必须适应GC内容和重复序列区域,以获得足够的覆盖深度以进行准确的基因型呼叫。床文件准确地表示面板上探针的感兴趣区域至关重要。最终,我们创建了为我们组装这些类型的床文件的脚本。我们正在使用我们为Lipidseq面板设计的第三个版本,并希望在2017年实施第四个版本。

问:与DesignStudio Software合作开发LipidSeq面板是什么感觉?

JR:DesignStudio软件在设计LipidSeq面板时很容易使用。在我们根据外显子边界设计了BED文件和正确的碱基对填充后,我们意识到我们的面板由编码外显子和snp的700kb捕获寡核苷酸组成。然后我们开始利用MiSeq系统的属性。我们观察了样本多路复用和不同的测序试剂盒,以确定我们将获得多少实际reads,从而确定我们将达到的覆盖深度。

问:LipidSeq面板的工作流程是什么?

JR:我们每周处理24个样品,大约两周的周转时间。将DNA从基因组浓度稀释到5ng /µl并不简单,但这是可行的,所以这需要几天的时间来完成。最初,我们使用Nextera快速捕获自定义富集试剂盒同时检测了12个人类DNA样本。随着MiSeq v3试剂试剂盒的问世,我们现在能够同时运行24个样品。

目前,这是一个两周的过程。在1-3天,我们使用Nextera快速捕获自定义富集试剂盒运行24个DNA样本,然后在MiSeq系统的24 plex上测序。24对FASTQ文件被发送到我们的服务器上,我们使用CLC Genomics Workbench软件对这些文件进行批处理,创建VCF文件,进入我们的注释管道。

“Lipidseq面板与Sanger测序的输出和周转时间甚至不是相当的。测序24样品使用MISEQ系统上的Lipidseq面板提供700 kB的每人测序数据... Sanger测序每次运行仅提供1000 BP。“

问:Lipidseq面板对MISEQ系统的输出和周转时间如何比较使用Sanger测序来识别变体?

JR:LipidSeq面板与Sanger测序的输出和周转时间甚至无法比较。利用MiSeq系统上的LipidSeq面板对24个样本进行测序,每人可获得700 kb的测序数据。在两周内,我们有文件的注释和罕见性和致病性分类,包括单基因和多基因变异。桑格测序只给出1000 bp的每次运行,这是一个最佳的猜测外显子与原因变异。另外,你必须使用TaqMan分析来获得多基因性状得分。

问:MISEQ系统生成的数据质量如何以及如何分析数据?

JR:MISEQ系统已运行良好,它产生了良好的数据集。我们的生物信息学软件可以同时处理批次的样本并产生良好的质量VCF和注释文件。在我们拥有这些文件后,我们要求我们的研究员策划个人数据。最终将700,000个捕获核苷酸降至VCF文件上的约800个核苷酸或支架位置。这800个核苷酸可减少到约20名候选人,对各种血脂血症综合征的因果关系进行有害性和令人愉快。此时,我们的员工正在策划一个小型子集,然后形成Hegele博士可以沟通回到他的研究科目的报告。

MiSeq系统成为了平台的选择。客户需要大量高质量的数据。其他测序技术可能有更快的周转速度,但它们无法与MiSeq系统提供的高质量数据竞争。”

问:如何在LipidSeq面板中添加新的基因座?

JR:我们在DesignStudio软件导入格式中创建标准床文件,该格式包含所有同种型和电子表格中内置的重复探测设计。DesignStudio软件从那里接管并给了我设计。如果存在低覆盖或GC内容警告,我们经常已经为此复制了探针。我们可以随时将UCSC基因组浏览器链接到UCSC基因组浏览器,看看探针将是什么样的。

问:在您的研究中使用Lipidseq面板是否有任何意外?

JR:在一些候选基因中有不同类型的变异模式和不同的多基因性状得分谱,这取决于我们观察的是哪种表现型或表现型的极端。它们是我们正在准备的科学手稿的重点。

Lipidseq面板使我们能够在迄今为止的所有2000年研究科目上获取完整的数据集,无论表型如何。VCF文件每人报告返回800到1000个变体。这为我们提供了从评估个体病例(受试者的表型的变异账面)来关联测试使用序列内核关联测试的工具来移动的机会。因此,我们可以从个人搬到队列和群体,使用NGS执行其他研究人员用微阵列进行的实验。在我们的情况下,我们将VCF文件用作受试者的变体调用文件。

问:您是否在您的实验室中使用MiSeq系统进行其他研究?

JR:我们让MiSeq系统忙于运行我们实验室的样品。我们是伦敦区域基因组中心(LRGC)的客户,该中心是赫格莱博士在罗伯茨研究所领导的核心实验室。我们的实验室也是安大略省神经退行性变研究计划(ONDRI)的核心实验室,该计划是安大略省大脑研究所的一部分。MiSeq系统使用ONDRISeq重测序面板处理样本,该面板设计用于识别与神经退行性疾病相关的变异。LRGC还有一个客户,他开发了一个基于药物基因组学的小组。LRGC还对许多细菌基因组和转录组进行测序,并对其MiSeq系统进行微生物组分析。

问:研究人员如何看待MiSeq系统的数据?

JR:他们乐于为我们提供DNA和RNA样本,并获得高质量的数据作为回报。例如,我们与LRGC的工作人员合作,建立满足客户需求的实验。他们喜欢MiSeq系统可以对小的细菌基因组和转录组进行测序,他们可以在一个运行墨盒上对多个样本进行测序,从而节省成本,并最终提供高质量的数据集。CLC Genomics Workbench软件使他们能够进行不同格式和实验设计的DNA和RNA分析。这些数据集产生不同条件下的细菌转录组和复杂环境中的微生物组的表达差异。

“LipidSeq面板使我们能够获得到目前为止我们测序的所有2000个研究对象的完整数据集……所以我们可以从个体转移到队列和群体,使用NGS来进行其他研究人员正在用微阵列进行的实验。”

问:你为什么选择MiSeq系统?

JR:我们是加拿大的第一个实验室之一,拥有离子洪流个人基因机(PGM)。对我们来说,PGM输出显而易见,我认为一个芯片为500 MB,大芯片在理论输出中是一个GB,与MISEQ系统的14 GB理论输出不匹配。MISEQ系统成为了选择的平台。客户需要大量高质量的数据。其他测序技术可能有更快的转变,但它们无法与MISEQ系统出现的高质量数据竞争。

问:在您的学习中,NEXTERA快速捕获定制套件如何?

JR:我们发现,使用Nextera快速捕获定制浓缩在我们的Lipidseq研究中一直有益。我们学会了与yobet亚洲基对填充一起玩,以确保我们在目标区域获得足够的覆盖范围。我们通常在我们的Nextera快速捕获自定义富集目标上实现200-400×覆盖范围。

问:您的实验室对从Sanger测序到NGS测序的转变有什么看法?

JR:我们的一些研究助理和高级员工参与了这一转变,并看到了在时间和成本方面的成功。然而,我们的第四年和新研究生期望他们能在两周内获得700kb的数据。

问:Robarts研究所的文化如何支持设计Lipidseq面板所需的创造力?

JR:Robarts研究所的文化提供了一个坚实的基础设施,支持其科学家。Hegele博士肯定是他研究的世界领导者,创造了一种吸引着创造性人的优秀工作环境和科学计划。它让我们在Sanger Box之外思考,并拥抱NGS等新技术。一个完美的例子是在同一Resequecing测定中转变执行外显子重型和多基因特征SNP评分的概念,并将其转化为Lipidseq面板的现实。这是创造力和良好洞察力的结果,组合桑格和Taqman测定工作流程并将它们转化为使用NGS的高吞吐量过程。

yobet亚洲亚博官网人口了解本文中提到的Illumina系统的更多信息:

Nextera快速捕获定制浓缩套件,
www.169o.com/products/by-type/sequencing-kits/library-prep-kits/nextera-rapid-capture-custom-enrichment.html

MiSeq系统,www.169o.com/systems/miseq.html

Designstudio自定义测定设计工具,www.169o.com/informatics/research/experishing-design/designstudio.html

有针对性的重新排序,
www.169o.com/techniques/sequencing/dna- sequencing/targeted-resequencing.html.

参考
  1. 美国心脏协会。心脏病和中风统计- 201y更新:一份来自美国心脏协会的报告。循环2017; 135:E146-E603。
  2. Johansen CT, Dube JB, Loyzer MN等。LipidSeq:单基因型血脂异常的新一代临床重测序面板。j of lipid res2014; 55(4):765-772。
  3. Hegele RA, Ban MR, Cao H, McIntyre AD, Robinson JF, Wang J.单基因血脂异常的靶向下一代测序。Curroping Lipidol.2015; 26(2):103-113。