客户采访

两个RNA库预备套件的故事

两种流行的TruSeq RNA文库制备试剂盒之间的关键比较揭示了进行RNA测序研究的研究人员感兴趣的新信息。

两个RNA库预备套件的故事

两个RNA文库制备试剂盒的故事

介绍

Raffaele Calogero是都灵大学分子生物技术和健康科学系的副教授。他领导生物信息学和基因组学单位,这是一个五人研究小组,专注于挖掘基因组和转录组数据,以识别生物标志物,并调查癌症和其他多因素疾病的分子基础。该团队设计自己的软件应用程序,并使用BaseSpace™Sequence Hub来分析RNA测序(RNA- seq)数据,并为其他研究团队提供测序和专家生物信息学支持服务。

作为基因组和转录组数据分析的专家,Calogero教授对如何生成RNA数据感兴趣。他最近正在进行简化实验室运营的新方法,他对Truseq RNA接入库预备套件*和Truseq RNA库预备套件进行了比较。对NextSeq™500系统进行测序,数据流到Basespace序列集线器,用于使用开源软件进行数据分析。

Choconity与Calogero教授谈到了该研究结果如何为变体检测,融合检测和圆形RNA分析提供RNA文库的制备。

Raffaele Calogero是都灵大学分子生物技术和健康科学系的副教授。

问:你的小组的研究重点是什么?

Raffaele Calogero(RC):我们的研究专注于肿瘤和生物标志物发现。我们还有一些项目集中在罕见的疾病相关生物标志物发现中进行药物反应和患者分层。例如,我们进行了研究,以鉴定参与抗华碱抑制剂屈服的基因。我们也参与了一种看着细胞外脉络RNA的白血病生物标志物表征研究。

我们在所有这些研究中使用的主要方法是差异基因表达分析。我们还使用异构体差异表达分析、融合检测和环状RNA检测。

问:您对RNA-SEQ研究使用哪些排序系统和数据分析软件?

RC:我们使用NextSeq 500系统进行RNA-Seq研究。NextSeq 500系统是我们理想的尺寸。它给了我们以动态方式进行实验的灵活性。整个星期都在使用。

对于数据分析,我们使用开源软件,主要是R1.和Python,2.我们还设计了数据分析脚本。因为我们主要从事肿瘤学工作,所以我们根据广泛研究所基因组分析工具包(GATK)的最佳实践准备DNA和RNA数据3.使用它的MuTect4.变体调用的软件。我们使用惠康中心的鸭嘴兽汇总静音结果5.变体调用者。

RNA Access使研究人员能够围绕一种单一的方法,为变体调用、融合检测和环状RNA识别整合文库准备。

问:如何促使您进行RNA库预备协议比较研究?

RC:我们正在寻找一种通过整合图书馆准备来提高实验室效率的方法。Truseq RNA接入库预备试剂盒靶标编码RNA的方式类似于外壳测序。我们认为RNA接入套件也可能对变体呼叫而不是Truseq RNA样品制备试剂盒工作,其靶向多腺苷酸化(PolyA)RNA物种。比较研究的范围扩展为评估RNA接入数据进行融合检测的适用性,这通常对多元捕获数据进行,以及圆形RNA分析,通常需要总RNA文库制备。

问:您是如何执行Truseq RNA Access与Truseq RNA样品准备数据比较研究的?

RC:Illumina的Gary Schroth博士为我们提供了使用Truseq RNA接入样品制备试剂盒,Truseq RNA样品制备试剂盒和总RNA制剂产生的乳腺腺癌(MCF7)细胞系RNA序列数据。我们收到了优秀的覆盖范围数据,使我们能够有效地进行比较研究。我们使用开源软件进行数据分析,包括明星6.根据GATK最佳实践,以两步模式进行映射。我们没有使用任何内部生物信息学工具,因为我们希望研究人员能够测试我们的方法。

问:比较研究的结果是什么?

RC:我们发现,与polyA-TruSeq RNA样本制备数据相比,在20%的低输入读取水平下,我们可以通过RNA访问检测到更多的变体−每个样本读取2500万次。在更高的读取级别,每个数据库中检测到的变体数量的差异会减小,直到在大约1亿次读取时达到零。

我们还发现,量脱靶RNA中的访问数据远低于在聚腺苷酸数据。在Polya数据中,我们看到许多读取的读取到代族地区,但我们没有看到RNA访问数据的同一件事。这是因为使用编码外显子序列设计了RNA访问方法,因此它比在相对低输入读取的变体中更有效。

“Basespace应用程序对较少经验丰富的生物信息管理员进行复杂分析,并使它们能够跟踪执行的分析步骤。”

问:考虑哪个RNA库准备套件使用时,研究人员应该记住什么?

RC:RNA接入比PolyA更有效,在每个样本的标准基因级别分析格式的标准基因级别分析格式中检测变体。然而,如果研究人员正在寻找编码外显子之外的变体,Polya显然是更好的选择,因为这些区域没有被RNA接入覆盖。

研究人员还应该考虑RNA Access方法提供的高水平的文库准备灵活性。例如,当我们搜索融合数据时,我们在RNA Access和polyA数据中发现了相同数量的融合转录本,即使在低输入水平。这意味着可以利用RNA Access在降解样品中寻找与polyA捕获不兼容的融合基因。

另一个有用的发现是,RNA访问支持循环RNA识别,这通常需要总RNA准备。因此,RNA访问使研究人员能够围绕单个方法整合用于变体调用、融合检测和循环RNA识别的库准备。虽然RNA访问的缺点是比polyA贵一点,但它在可检测的RNA类型方面提供了更大的灵活性。与polyA不同,它还提供了一种标准化不同质量的RNA样本的方法。

问:在使用这些RNA库预备方法之前,研究人员是否应该理解的独特情况?

RC:在罕见情况下,可以在相同的股线上定位编码和非编码基因。他们正在分享一个公共区域的一部分,但外显子和内含子没有完全重叠。在这种情况下,我们可以将读取分配给属于同一链的编码和非编码区域的特定外显子。除非通过查看周围序列,否则我们可能无法正确地将读取正确分配给编码或非编码区域。

尽管我们在RNA Access和polyA数据中发现了相同数量的融合转录本,但检测任何特定的融合转录本的能力都依赖于RNA文库的预先准备。由于MCF7已经得到了很好的研究,我们收集了所有已发表的经过验证的融合事件。我们使用佳发7.在RNA Access和polyA数据中搜索它们。我们从RNA的技术复制开始,所以唯一的区别是文库准备。在两个数据集中都检测到了一些融合。然而,其他融合仅存在于一个或另一个数据集中。很难说一种RNA文库制备方法在检测融合转录物方面是否优于另一种。我认为它们是可比的。

问:研究中的下一步是什么?

RC:我们正在准备一篇关于TruSeq RNA Access与TruSeq RNA库准备比较的论文,准备提交发表。我们希望其他人很快就有机会详细审查这项研究。

在我们的克里唑替尼抑制剂研究中,我们正在使用来自相同样本的RNA-Seq、外显子组和microRNA数据。我们使用RNA Access来观察淋巴瘤细胞系从克唑替尼敏感到克唑替尼耐药的转化过程中发生了什么变化。利用RNA Access,我们可以将表达的变异与外显子水平的数据关联起来,并确定哪些是影响功能蛋白的。

对于我们的白细胞生物标志物表征研究,我们有数百种急性淋巴细胞(全部),急性髓鞘(AML)和慢性淋巴细胞(CLL)白血病样品以及其他白血病样品的数据。我们正在寻找RNA细胞外转录组和患者临床历史之间的潜在关系。

问:其他研究人员如何利用您的团队在生物信息学方面的知识和专长?

RC:Basespace序列集线器为我们提供了一种有效的方法,用于分享我们的生物信息学体验。我们有一个用于MiRNA分析的Basespace应用程序,该应用程序已经在Basespace序列集线器中,另外两个是在发布下的其他内容。目前,没有一个用于循环RNA检测的应用。但是,我们开发了一个嵌入Ciri的人8.软件,并提交给BaseSpace Sequence Hub发布。

我们设计了BaseSpace应用程序,以使没有生物信息学专家的生物学家复制我们在实验室中开发的分析。BaseSpace应用程序对更少经验丰富的生物信息管理员进行复杂分析,并使它们能够跟踪执行的分析步骤。另一个优点是,通过Basespace应用程序,无需构建本地基础架构。用户可以访问所需的实验所需的计算资源。

我们还使用BaseSpace Sequence Hub作为基因组和转录组数据分析课程的教学工具,我们已经在意大利和新加坡以及德国的欧洲分子生物学实验室(EMBL)向生物学家提供了这些课程。BaseSpace Sequence Hub最有趣的特性之一是它直观的界面。当我要求湿实验室的科学家使用它时,他们不会因为必须编写分析脚本而分心。相反,他们可以集中精力理解分析步骤。有了BaseSpace Sequence Hub,研究人员可以更专注于他们所做事情的生物学原因,而不是他们是如何做的。

yobet亚洲亚博官网人口了解有关本文中提到的Illumina产品和系统的更多信息:

Basespace序列集线器,www.169o.com/products/by-type/informatic-products/basespace-sequence-hub.html

nextseq 550系统,www.169o.com/systems/sequencing-platforms/nextseq.html.

Truseq RNA接入库预备套件(目前称为Truseq RNA Exome),www.169o.com/products/by-type/sequencing-kits/library-prep-kits/truseq-prona-access.html.

参考文献
  1. 统计计算的R项目。www.r-project.org/. 查阅日期:2017年11月10日。
  2. Python,www.python.org./,访问2017年11月10日。
  3. 博德学院。基因组分析工具包。software.broadinstitute.org/gatk/. 查阅日期:2017年11月10日。
  4. mutect1。基因组分析工具包。software.broadinstitute.org/gatk/download/mutect. 查阅日期:2017年11月10日。
  5. 鸭嘴兽:下一代序列数据的基于单倍型的变体调用者。惠康人类遗传学中心。www.well.ox.ac.uk鸭嘴兽. 查阅日期:2017年11月10日。
  6. Dobin A,Davis Ca,Schlesinger F等人。STAR:超快通用RNA序列比对器。生物信息学.2013; 29:15-21。
  7. GitHub。oshlack / jaffa。github.com/oshlack/jaffa/wiki.. 查阅日期:2017年11月10日。
  8. 高y,王j,赵f。CIRI:一种高效、无偏的算法德诺维环状RNA识别.基因组医学杂志.2015; 16:4 DOI:10.1186 / S13059-014-0571-3。

*目前称为Truseq RNA Exome

†nextSeq 500系统不再可用,已被NextSeq 550系统取代。