客户面试

Streamline NGS数据分析,管理和存储

BaseSpace Sequence Hub提高了牛津实验室的生产力和成本效益,以满足其临床研究团队的需求。

Streamline NGS数据分析,管理和存储

NGS数据分析,管理和云中的存储

介绍

今天的下一代测序(NGS)系统产生了大量的数据,这使得研究人员想知道如何有效地管理、分析和存储所有这些信息。云提供了一个解决方案,提供无限的数据存储,实时排序运行监控,并访问强大的数据分析工具。对于牛津分子诊断中心(OMDC)血液-分子诊断实验室的首席临床科学家Helene Dreau来说,这也减少了创建生物信息学服务的需要。亚博下载app

无助者和她的五个人团队负责支持牛津大学和牛津大学医院国家卫生服务(NHS)基金会信任的大型临床和研究小组的基因组努力。使用Illumina Miseq,Hiseq 2500和Hiseq 4000系统,她转向Basespace信息套件进行数据分析。随着她集团的排序系统生成的数据量增加,DRAU将转换为Basespace序列集线器,用于Amazon Web服务云中的存储,协作和数据管理。

iccommunity与德罗谈论了她将NGS数据分析转移到云端的决定,以及这给她的实验室带来的好处。

Helene Dreau,理学硕士,牛津分子诊断中心(OMDC)血液分子诊断实验室首席临床科学家。亚博下载app

问:您的实验室支持牛津大学的哪些临床研究团队?

海琳Dreau (HD):我们在牛津医院提供与血液病(血红蛋白病、血友病、白血病、淋巴瘤等)相关的检测服务。我们提供专门的检测,包括DNA和RNA测序,以及流式细胞术。我们也是泰晤士河谷癌症网络的一部分,负责在专业注册人员(医生)到地区医院完成培训之前对他们进行教学。

我们支持牛津医院的临床研究研究。我们还与国家卫生研究所(NIHR)牛津生物医学研究中心合作,该研究中心专注于推动预防,诊断和治疗疾病的创新,并将生物医学研究进展转化为临床实践。我们开发并验证新技术以支持这些努力。在过去的十年中,这些实体的资金使我们能够获得最新的工具和技术成为基因组中心。

问:你们的实验室什么时候开始使用NGS的?你们进行哪些类型的测序应用?

高清:我们在2013年收购了MiSeq系统,随后增加了HiSeq 2500和HiSeq 4000系统。我们使用靶向测序面板,如TruSeq Custom Amplicon*,并正在开发一种易位面板。我们也执行RNA-Seq。

问:您对实验室中的Missq和Hiseq系统的评估是什么?

“BaseSpace Sequence Hub使我们能够分析、存储和传播数据,而不需要生物信息学人员或服务器。它还支持我们增加的数据分析工作量。”

高清:我们的Illumina NGS系统运行良好,我对它们很满意。我已经开始使用Illumina礼宾服务来设计目标面板。使用MiSeq系统的目标面板服务,我获得了更高的测序效率和更可靠的结果。效率对我来说至关重要,因为MiSeq系统是我们实验室的主力。该仪器的建立过程简单,便于仪器的清洁和维护。

问:为什么你们的实验室团队没有加入生物信息学专家?

高清:我们没有足够的预算雇佣生物信息学人员。即使我们这样做了,也很难吸引生物信息学家到NHS的实验室。如果他们很优秀,他们想在学术界发表论文,或者在工业界获得更高的薪水。有经验的生物信息学家对提供常规服务、运行数据分析管道、评估和传播结果的职位不感兴趣。

问:当您第一次收购MiSeq System时,您是如何分析和管理数据的?

高清:我们在MiSeq系统上使用BaseSpace Software**和MiSeq Reporter软件进行数据分析。

问:在加入海高2500和4000系统后,你们的数据分析和管理需求有什么变化?

高清:在我们添加了HiSeq 2500和HiSeq 4000系统后,NGS数据量急剧增加。我们还看到临床研究的靶向面板测序需求增加了20%,我们的其他牛津合作伙伴对基因组检测也更感兴趣。

问:您认为满足NGS数据分析,管理和存储需求的需求是哪些选择?

高清:我们构建了一个在现场安装服务器的业务案例,但发现这超出了我们的预算,需要改变基础设施来支持。此外,服务器的持续维护成本太高。我们决定在2015年开始使用BaseSpace Sequence Hub中的BaseSpace Apps进行分析。2016年8月,我们过渡到BaseSpace Sequence Hub,该企业领域提供可扩展存储(> 1tb)和24小时生物信息学专业服务支持。BaseSpace Sequence Hub使我们能够在不需要生物信息学人员或服务器的情况下分析、存储和传播数据。它还支持我们增加的数据分析工作负载。

“BaseSpace Sequence Hub为我们提供了对NGS数据的远程访问……它使我们能够保持项目的进展和响应,即使是在周末或当我们在外地开会时。”

问:你们如何管理对NGS研究数据的访问?

高清:通过使用BaseSpace Sequence Hub,我们有了一个用于数据分析、存储和分发的平台,这使得共享更容易,成本更低。我可以为不同的研究项目创建多个工作组,并为特定用户提供访问权限。研究人员喜欢他们可以远程查看数据的事实。

Basespace序列集线器还使我能够控制数据访问,并分别维护我们的研究项目数据。重要的是,我们认为我们的研究工作隐私。

问:您的团队如何在云中执行数据分析?

高清:我们运行面板,选择并运行相应的Basespace应用程序,然后对生成的数据进行技术审阅。我们都是所有分子生物学家,而不是培养的生物信息管理员。我们很高兴设置Basespace应用程序并执行数据分析。

问:在Basespace序列集线器中是否存在管理项目的其他好处?

高清:BaseSpace Sequence Hub为我们提供了对NGS数据的远程访问,这在我们需要快速返回结果或当我们离开实验室时非常有用。当周六下午运行结束时,我们可以远程启动管道,并使用整合基因组查看器(IGV)和VariantStudio软件在云中分析数据。BaseSpace Sequence Hub使我们能够保持项目的运行和响应,即使是在周末或当我们在外地开会时。

通过远程访问,我们也可以轻松查看运行趋势。如果我们看到奇怪的东西,我们可以使用云中的序列分析查看器(Sav)软件并与Illumina Tech Charpor中共享数据。它使技术支持团队能够快速识别问题并如有必要地发送工程师。在仪器管理中对我们有用。

问:你在使用哪些BaseSpace应用程序?

高清:Basespace序列集线器上提供的应用程序数量是好的,并且他们涵盖了我们工作的许多方面。我们使用TSCA应用程序为TruseQ自定义扩增子面板。对于开发和验证工作,我们使用FASTQC来检查NGS数据,以及FASTQ Toolkit来操纵FastQ文件并执行适配器和质量修剪,长度过滤和下降采样。有一些应用程序可以在管道中拉下来快速查看数据,然后使用稍后的花式管道进行分析。对于全基因组测序(WGS),我们使用Illumina全基因组测序应用程序。对于肿瘤正常的减法,我们使用肿瘤正常的应用程序,该应用程序使用Strelka Somatic Variant来电者呼叫肿瘤匹配样品中的体细胞小变体,结构变体和复制数改变(CNA)。

“没有Basespace序列集线器,它会更长时间,它会花费更多的数据输出和运营效率。”

问:BaseSpace Sequence Hub支持国际标准化组织(ISO)认证吗?

高清:作为一个NHS用户,我必须是ISO认证,我所做的一切都需要验证或验证。为了验证我的过程,我必须测试所有参数,确保系统不会崩溃。如果我使用制造商提供的系统,如BaseSpace Sequence Hub,则验证管道的责任在制造商。我要做的就是验证它是否有效。

英国认证服务(UKAS)还要求我使用的供应商符合所有相关标准。BaseSpace Sequence Hub的ISO 27001认证使我不再需要证明在我们的工作流中这一步已经实现了QA。

问:如果没有Basespace序列集线器,您可以提供您提供的服务吗?

高清:如果没有BaseSpace Sequence Hub,我们将花费更长的时间和更多的成本来达到这个级别的数据输出和操作效率。我们需要招募一名对建立存储、管理和共享NGS数据的过程和系统感兴趣的生物信息学家。通过BaseSpace Sequence Hub,我们能够简化我们的数据分析,并有效地提高我们的生产率成本,同时为研究人员和临床医生提供一种安全的方式访问他们的数据。

问:实验室经理在将他们的NGS数据转移到云之前应该考虑什么?

高清:如果有人在考虑使用云使用NGS数据分析,存储和分发,则需要考虑许多事情。他们需要确定它们会生成多少数据,他们将执行哪些类型的分析,以及保留数据需要多长时间。在云中工作的费用涉及许可证的费用。它还包括存储和计算时间的成本。它让人们惊喜由ngs运行多少数据。他们没有意识到他们将收到FASTQ,BAM和VCF文件,其中占用云中的存储空间,增加成本。他们需要计算它们是否收到的福利超出了创建生物信息框架本身的成本。在我们的情况下,使用Basespace序列集线器是一种经济效益的分析方式,存储,管理和共享我们生成的NGS数据。购买服务器的成本,即使是我们的临床工作,雇用生物信息管理人员在目前的预算环境中对我们而言是对我们的成本持久。

信息治理也是一个问题。对于目标小组,我们获得的数据是匿名的,以保持病人的机密。对于WGS服务来说,仍然存在保密问题。目前,我们正在通过获得与会者的同意来克服这个问题,但今后,这将是一个挑战。

问:您如何看待您的实验室在未来的发展?

高清:我们正在创建更多有针对性的面板,并希望建立自己的私人临床WGS练习。我们正在为产前应用开发无细胞DNA工作和早期检测肿瘤和最小残留疾病(MRD)。我们还计划将WGS数据与RNA-SEQ集成。

问:您是否可以对Basespace序列集线器中的这些应用程序执行数据分析?

高清:我们在BaseSpace Sequence Hub中开发了一些分析管道。由于我们的企业账户为我们提供了24小时的生物信息学专业服务支持,我们将与Illumina合作开发几个新的BaseSpace应用程序。

yobet亚洲亚博官网人口了解本文中提到的Illumina系统和产品的更多信息:

Basespace序列集线器,www.169o.com/products/by-type/informatics-products/basespace-sequence-hub.html

BaseSpace应用程序,www.169o.com/products/by-type/informatics-products/basespace-sequence-hub/apps.html

MiSeq系统,www.169o.com/systems/sequencing-platforms/miseq.html.

HiSeq系统,www.169o.com/systems/sequencing platforms/hiseq - 2500. - html

AmpliSeq for Illumina Custom DNA Panel(取代TruSeq Custom Amplicon),www.169o.com/products/by-type/sequencing-kits/library-prep-kits/ampliseq-custom-dna-panel.html

*TruSeq Custom Amplicon已停产。推荐的替代品是Illumina定制DNA面板的AmpliSeq。

**BaseSpace Software是BaseSpace Suite的前身。