在无细胞DNA中寻找癌症驱动基因表达线索
介绍
核小体是一个微小而优雅的DNA包装。就像长遗传项链上的珠子一样,每个核小体包含一个小的DNA旋转部分,包裹在8种被称为组蛋白的特殊蛋白质周围。事实证明,核小体可能包含的远不止这些。它可能为哪些基因导致转移性癌症提供线索。
2016年,华盛顿大学的一个团队分析了健康个体细胞游离DNA (cfDNA)中核小体的占据图。1.这些体内占用图与单细胞表达的结构和组织高度相关。这表明在核小体中可能存在来自组织起源的表观遗传足迹。该研究的作者认为,当没有其他明显的基因型差异时,这种足迹可以用来确定导致疾病的不同细胞类型。研究cfDNA中存在的核小体也可能为使用非侵袭性筛查(如液体活检)检测癌症提供新的方法。
与此同时,格拉茨医学大学人类遗传学研究所Michael Speicher教授实验室的一个团队也在研究CFDNA中生物相关信息。因为cfDNA是受核小体保护的DNA,他们关注的是cfDNA的包装是否有功能数据。他们是对的,证明转录起始位点的核小体占据模式提供了推断癌症驱动基因表达的信息。2.
iCommunity采访了Speicher教授的同事,癌症研究部个性化医学液体活检负责人Ellen Heitzer博士和生物信息学家Peter Ulz理学硕士。他们讨论了他们的核小体研究,以及使用他们的算法分析的液体活检数据如何为研究人员提供有关癌症进展和治疗反应的重要信息。
Ellen Heitzer博士是癌症研究中心个性化医学的液体活组织检查的负责人,Peter Ulz,MSC是格拉茨医学大学人类遗传学研究所的一组生物信息学家。
问:你们研究单位的疾病重点是什么?
彼得Ulz (PU):我们学院有70名员工,由迈克尔·斯皮彻教授领导。大多数员工对遗传性疾病进行常规诊断化验,但我们也对各种液体活检应用进行研究。
埃伦·海泽(呃):我的主要兴趣是癌症研究。我参与了家族性癌症综合征的常规诊断和液体活检的基因分析方法研究。六年多以来,我们一直致力于无创、纵向监测血浆中亚博下载app癌症基因组的方法。
过去,我们研究单个循环肿瘤细胞。我们现在赞成对ctDNA进行分析。它是一种更好的标记物,比单个循环肿瘤细胞更全面地覆盖肿瘤。
问:液体活检的价值是什么?
嗯:传统的组织活检提供了肿瘤的实时快照。然而,很难每四周进行一次组织活检来观察肿瘤的变化。相反,我们可以很容易地每隔几周进行一次液体活检。因此,液体活检使我们能够跟踪研究对象的整个疾病过程,从诊断到治疗反应,再到癌症复发。
液体活检的研究领域是动态的,我们正在取得快速的进展。
问:从生物信息学的角度来看,从液体活检样本分析DNA测序数据的挑战是什么?
聚氨基甲酸酯:许多人发现测序运行中的数据量太大,难以分析。这不是我们实验室中最困难的问题,因为我们正在进行小规模测序。我们面临的挑战是,我们从ctDNA测序中获得的信号非常低。根据肿瘤分期和各种其他参数,正常细胞的cfDNA数量可能显著超过肿瘤来源的DNA。在消除过程中出现的偏差的同时,很难从微量的DNA和更小的肿瘤部分获得好的信息。
问:是什么激发了研究cfDNA转录因子结合位点核小体占据模式的想法?
聚氨基甲酸酯:因为cfDNA是受核小体保护的DNA,我们最初的设想是,在cfDNA包装的方式中,液体活检样本中必须隐藏更多的信息。在阅读了几篇关于染色质重塑和MNase-Seq的出版物后,3.我们设想这适用于cfDNA。我们有来自低覆盖率全基因组测序(WGS)的数据,并观察是否有信号类型可以指示基因是否表达。然后我们回顾了100多个对照组的测序数据,看看是否有类似的信号。这些结果令人鼓舞,我们用它们来构建这项研究。华盛顿大学的研究利用了相同的信号来推断起源组织,这进一步增加了我们的兴奋感。
“我们了yobet亚洲解到转录起始位点的核小体对表达基因和非表达基因的覆盖模式不同。”
问:为什么在这种新方法中选择使用WGS而不是全外显子组测序(WES) ?
聚氨基甲酸酯:核小体占据信号位于转录位点的最开始。大多数外显子组测序试剂盒丰富了基因组的编码部分,而不是未翻译区域,这是我们获得最高信号的地方。即使外显子组富集分析会使未翻译区富集,未翻译区前不久的部分也会丢失。不幸的是,这是我们找到表达式信息的区域。
问:你的研究结果是什么?
聚氨基甲酸酯:我们使用WGS分析癌症患者血浆中发现的cfDNA。在基因表达过程中,一个核小体在转录起始位点被移除。当细胞凋亡时,cfDNA被释放到血液中,这个核小体耗尽区(NDR)优先被核酸酶消化,因为它不受组蛋白的保护。这意味着在循环中,核小体不被移除的非活性基因的DNA片段比活性基因更丰富。我们发现,转录起始位点的核小体对表达的和未表达的基因表现出不同的覆盖模式。这种模式可以通过测序数据建立起来。使用机器学习算法,我们可以高精度yobet亚洲地预测哪些基因可能导致这种疾病。
该研究最有趣的方面是,该方法适用于健康人和癌症受试者。我们可以推断出很多基因的表达。到目前为止,我们已经对高覆盖率癌症受试者的两个ctDNA样本进行了测序。数据看起来很有希望,我们正在研究该方法在更广泛的样本范围内的适用性,以及我们是否可以将其用于不同肿瘤实体的详细分析。
问:您如何确认从WGS推断的癌症样本的表达结果?
聚氨基甲酸酯:为了证实我们的表达预测,我们将我们的数据与相应原发肿瘤的RNA-Seq数据进行了比较。我们专注于高拷贝数增加的区域,因为与平衡区域相比,这些区域相对丰富,可以在循环中达到很高的肿瘤分数。我们从这些区域提取RNA-Seq数据,并将其与我们的算法预测的基因表达进行比较。这些预测被证实了。目前,我们正在改进我们的方法,使其更加敏感,这样我们就可以用我们在血浆中发现的ctDNA更普遍地进行预测。
“为了证实我们的表达预测,我们将我们的数据与相应原发肿瘤的RNA-Seq数据进行了比较。”
问:你用什么软件来分析数据?
聚氨基甲酸酯:我们使用Burrow-Wheeler Aligner (BWA)进行DNA比对,并使用SAMTools查看转录起始位点周围的覆盖范围。对于基因表达预测,我们使用基于支持向量机的机器学习方法。yobet亚洲
问:在进行这项研究时,您面临哪些挑战?
聚氨基甲酸酯:样本量和测序成本是重大挑战。尽管我们有数百个样本和来自低覆盖率工作组的相应数据集,但由于我们感兴趣的区域缺乏测序深度,这些数据无法使用。我们无法在高覆盖率下对它们进行排序以补偿低信号,因此我们合并了数据以克服此问题。
Q:为了支持将您的方法转变为临床环境,需要哪些增强功能?
聚氨基甲酸酯:我们发现,使用我们的方法得到的结果存在一些问题。例如,高表达基因和非高表达基因的核小体组织存在差异。高基因表达的基因具有非常严格的核小体组织,我们的方法成功地预测了这些基因的表达。核小体组织不严格的基因更难评估,我们的算法通常预测它们不表达,无论它们是否表达。因此,我们的算法目前无法预测样本中每个基因的基因表达。我们正在努力纠正这个问题。
我们还需要更高的肿瘤液体活检分数来应用于临床,因为信号被通常凋亡过程中的正常DNA“污染”了。在我们的研究中,两个肿瘤样本的肿瘤成分都很高。我们可能不会在所有的受试者样本中发现这一点。即使是高肿瘤分数的样本,我们仍然必须关注那些过度代表、拷贝数改变和增加的区域。目前,我们只能在少数几个区域预测基因是否表达。我们希望能找到更多。
“对于基因表达预测,我们使用基于我们开发的支持向量机的机器学习方法。”yobet亚洲
问:cfDNA基因表达如何帮助我们在未来理解疾病?
聚氨基甲酸酯:科学家们一直在寻找肿瘤的基因变异和突变。这导致了分子肿瘤学和治疗反应鉴定的巨大进步。然而,一些信息缺失。我们相信,我们对肿瘤中基因表达的分析将使我们能够在疾病和治疗期间跟踪肿瘤中发生的情况。我们希望这将为我们提供一个全新的信息谱,可用于确定药物靶点或监测治疗,并在出现治疗耐药性的第一个迹象时捕捉它们。
嗯:我们的方法的另一个好处是,我们可以执行复制数分析并从相同的数据集中提取表达式数据。在最近的一项研究中,我们报道了前列腺癌新灶性放大的出现。4.肿瘤基因组在肿瘤发展过程中是高度动态的。在未来,我们的方法可以告诉我们,位于这种局灶扩增中的基因是否在肿瘤中表达,以及它是否负责推动疾病的进展或对治疗的耐药性。我们相信,如果cfDNA中有足够的肿瘤DNA,我们可以将这种方法应用于任何类型的癌症。
“MiSeq和NextSeq工作流简单,排序速度快,大大节省了时间。”
问:如果发现了新的标记物,你能利用这些研究的原始数据来评估不同基因表达水平的存在以了解疾病进展吗?
聚氨基甲酸酯:我们可以结合新识别的标记,如果它们是基于基因的表达。目前,我们需要专注于复制数量增加的地区的标记。这可能会限制对其他类型标记的搜索。理论是,如果信号足够高并且有大量的肿瘤碎片,我们可以检查基因中是否有某种反应。我们正在努力。
问:MiSeq和NextSeq系统是如何帮助你进行研究的?
嗯:MiSeq和NextSeq工作流程简单,排序速度快,大大节省了时间。从血浆DNA提取到最终结果,我们可以在2-3天内完成低覆盖率WGS。这两个系统都提供了快速的数据访问,这对我们来说是一个显著的优势。
问:你为什么选择TruSeq®纳米DNA库准备工具包?
嗯:我们选择TruSeq Nano DNA Library Prep Kit是因为它可以支持低样本输入。我们取得了巨大的成果。对于拷贝数分析和WGS,我们很高兴使用这个试剂盒,并打算继续使用它。
问:你下一步的研究是什么?
聚氨基甲酸酯:我们致力于使我们的方法更加敏感,以便它能够与肿瘤DNA比例较低的cfDNA一起工作。这将使我们能够观察疾病早期的样本。我们越早获得关于肿瘤的信息,我们就越有机会告知治疗决定。
嗯:我们还试图分析血浆DNA的其他标记物、突变和拷贝数改变,这些可以在不了解原发肿瘤和驱动其生长的基因的情况下使用。我们正试图从通常的可疑突变中提取其他信息,以发现新的标志物,帮助我们监测和筛查癌症患者。这是大量的生物信息学工作。
“我们致力于使我们的方法更加敏感,以便它能够与肿瘤DNA比例较低的cfDNA一起工作。这将使我们能够观察疾病早期的样本。”
问:您是否计划在未来的研究中使用Illumina产品?
聚氨基甲酸酯:我们将继续使用MiSeq和NextSeq Systems,以及TruSeq Nano DNA Library Prep Kit。
我们现在正在用更少的测序数据测试我们的方法,通过执行目标富集,以及通过缩小信号较低的实验规模来减少我们的覆盖需求。我们已经为此目的测试了一些Illumina DNA富集试剂盒。通过优化我们的方法,我们希望利用所有现有的数据集。
嗯:我们还使用了TruSeq纳米DNA和Nextera的组合®靶向重测序的快速捕获方案。我们还有一个正在进行中的Illumina Concierge项目,我们正在运行TruSeq癌症扩增试剂盒(TruSeq Cancer Amplicon Kit),它具有独特的分子标识符。如果我们的研究要用于临床,我们就必须专注于已知的、可行的目标。这将比分析整个基因组来确定正确的治疗方法或病人为什么对某种疗法有耐药性更有效。
yobet亚洲亚博官网人口了解有关本文中提到的Illumina系统和产品的更多信息:
MiSeq系统,www.169o.com/systems/MiSeq.html