客户面试

Streamline NGS数据分析,管理和存储

Basespace序列集线器增加了牛津实验室的生产力和成本效益,满足其临床研究团队的需求。

Streamline NGS数据分析,管理和存储

NGS数据分析,管理和云中的存储

介绍

今天的下一代测序(NGS)系统产生了大量的数据,使得研究人员想知道如何有效地管理、分析和存储所有这些信息。云提供了一个解决方案,提供无限的数据存储,实时测序运行监控,并访问强大的数据分析工具。对于牛津分子诊断中心(OMDC)血液分子诊断实验室首席临床科学家、理学硕士Helene Dreau来说,它还减少了创建生物信息学服务的需求。亚博下载app

无助者和她的五个人团队负责支持牛津大学和牛津大学医院国家卫生服务(NHS)基金会信任的大型临床和研究小组的基因组努力。使用Illumina Miseq,Hiseq 2500和Hiseq 4000系统,她转向Basespace信息套件进行数据分析。随着她集团的排序系统生成的数据量增加,DRAU将转换为Basespace序列集线器,用于Amazon Web服务云中的存储,协作和数据管理。

Icommunity与Awareau女士讨论了她的决定将NGS数据分析转移到云端以及它提供了它的实验室的好处。

Helene Dreau,理学硕士,牛津分子诊断中心(OMDC)血液分子诊断实验室首席临床科学家。亚博下载app

问:牛津的临床研究团队是你的实验室支持吗?

海琳Dreau (HD):我们在牛津医院进行与血液疾病(血红蛋白病,血友病,白血病,淋巴瘤,淋巴瘤等)相关的测试服务。我们提供专门的测试,包括DNA和RNA测序,以及流式细胞术。我们也是泰晤士河谷癌症网络的一部分,并负责在他们完成培训的区域医院之前教授专业注册商(医生)。

我们支持牛津医院的临床研究研究。我们还与国家卫生研究所(NIHR)牛津生物医学研究中心合作,该研究中心专注于推动预防,诊断和治疗疾病的创新,并将生物医学研究进展转化为临床实践。我们开发并验证新技术以支持这些努力。在过去的十年中,这些实体的资金使我们能够获得最新的工具和技术成为基因组中心。

问:您的实验何时开始使用NGS以及您执行哪些类型的排序应用程序?

高清:2013年,我们收购了一个MiSeq系统,后来又增加了HiSeq 2500和HiSeq 4000系统。我们使用目标测序面板,如TruSeq Custom Amplicon*,并正在开发一个易位面板。我们也进行rna测序。

问:您对实验室中的Missq和Hiseq系统的评估是什么?

“BaseSpace序列中心使我们能够分析、存储和传播数据,而不需要生物信息学人员或服务器。它还支持我们增加的数据分析工作量。”

高清:我们的Illumina NGS系统运行良好,我对它们感到满意。我已经开始使用Illumina Concierge服务来设计目标面板。我使用MiSeq系统上的目标面板服务获得了更高的测序效率和更可靠的结果。效率对我来说至关重要,因为MiSeq系统是我们实验室的主力。建立测定方法的过程简单,仪器易于清洁和维护。

问:你为什么没有在你的实验室团队中加入生物信息学专家?

高清:我们没有雇佣生物信息学人员的预算。即使我们做到了,也很难把生物信息学家吸引到NHS实验室来。如果他们是优秀的,他们想要进入可以发表论文的学术领域,或者进入可以赚取更高薪水的行业。有经验的生物信息学家对提供日常服务、运行数据分析管道、评估和传播结果的职位不感兴趣。

问:当你第一次获得MiSeq系统时,你是如何分析和管理数据的?

高清:我们在MISEQ系统上使用了Basespace Software **和MiSeQ Reporter软件进行数据分析。

问:HiSeq 2500和4000系统加入后,你们的数据分析和管理需求有何变化?

高清:在加入HiSeq 2500和HiSeq 4000系统后,NGS的数据量显著增加。我们还发现,临床研究的定向面板测序请求增加了20%,我们在牛津的其他合作伙伴对基因组测试的兴趣也增加了。

问:您认为满足NGS数据分析,管理和存储需求的需求是哪些选择?

高清:我们建立了一个业务案例,在现场有一个服务器,但发现这超出了我们的预算,并需要改变基础设施来支持。此外,服务器的持续维护成本高昂。我们决定从2015年开始在BaseSpace Sequence Hub中使用BaseSpace Apps执行分析。2016年8月,我们过渡到BaseSpace Sequence Hub,拥有一个企业域,提供可扩展存储(> 1tb)和24小时生物信息学专业服务支持。BaseSpace序列中心使我们能够分析、存储和传播数据,而不需要生物信息学人员或服务器。它还支持我们增加的数据分析工作负载。

“Basespace序列集线器为我们提供远程访问我们的NGS数据......它使我们能够保持项目移动并响应于周末或在场外会议时。”

问:您如何管理您的研究NGS数据的访问?

高清:通过使用BaseSpace Sequence Hub,我们有了一个用于数据分析、存储和分发的平台,这使得共享更容易、更具有成本效益。我可以为不同的研究项目创建几个工作组,并为特定用户提供访问权限。研究人员喜欢他们可以远程查看数据的事实。

Basespace序列集线器还使我能够控制数据访问,并分别维护我们的研究项目数据。重要的是,我们认为我们的研究工作隐私。

问:您的团队如何在云中执行数据分析?

高清:我们运行面板,选择并运行相应的Basespace应用程序,然后对生成的数据进行技术审阅。我们都是所有分子生物学家,而不是培养的生物信息管理员。我们很高兴设置Basespace应用程序并执行数据分析。

问:在Basespace序列集线器中是否存在管理项目的其他好处?

高清:BaseSpace Sequence Hub为我们提供了对NGS数据的远程访问,这在我们需要快速返回结果或离开实验室时非常有用。当一个周六下午的运行结束时,我们可以远程启动管道,使用整合基因组观察器(IGV)和VariantStudio软件在云中分析数据。BaseSpace Sequence Hub使我们能够保持项目的进展和响应,甚至在周末或我们在外地开会的时候。

通过远程访问,我们也可以轻松查看运行趋势。如果我们看到奇怪的东西,我们可以使用云中的序列分析查看器(Sav)软件并与Illumina Tech Charpor中共享数据。它使技术支持团队能够快速识别问题并如有必要地发送工程师。在仪器管理中对我们有用。

问:您正在使用哪些BaseSpace应用程序?

高清:Basespace序列集线器上提供的应用程序数量是好的,并且他们涵盖了我们工作的许多方面。我们使用TSCA应用程序为TruseQ自定义扩增子面板。对于开发和验证工作,我们使用FASTQC来检查NGS数据,以及FASTQ Toolkit来操纵FastQ文件并执行适配器和质量修剪,长度过滤和下降采样。有一些应用程序可以在管道中拉下来快速查看数据,然后使用稍后的花式管道进行分析。对于全基因组测序(WGS),我们使用Illumina全基因组测序应用程序。对于肿瘤正常的减法,我们使用肿瘤正常的应用程序,该应用程序使用Strelka Somatic Variant来电者呼叫肿瘤匹配样品中的体细胞小变体,结构变体和复制数改变(CNA)。

“没有Basespace序列集线器,它会更长时间,它会花费更多的数据输出和运营效率。”

问:BaseSpace Sequence Hub支持ISO (International Organization for Standardization)认证吗?

高清:作为NHS用户,我必须是ISO认可,我所做的一切都需要验证或验证。要验证我的进程,我必须测试所有参数并确保系统不会破坏。如果我正在使用制造商提供的系统,例如Basespace序列集线器,则验证该管道的责任在制造商上。我所要做的就是验证它是否有效。

英国认证服务处(UKAS)也要求我使用的供应商符合所有相关标准的认证。BaseSpace Sequence Hub的ISO 27001认证使我无需证明在我们的工作流程中这一步已经实现了QA。

问:如果没有Basespace序列集线器,您可以提供您提供的服务吗?

高清:如果没有Basespace序列集线器,它将更长时间才能让我们更长时间,并且可以增加这种数据输出和运行效率。我们需要招募有兴趣设置流程和系统以存储,管理和共享NGS数据的生物信息管理员。使用Basespace序列集线器,我们能够简化我们的数据分析并提高生产力成本,同时为研究人员和临床医生提供了一种访问其数据的安全方法。

问:实验室经理在将NGS数据移到云上之前应该考虑什么?

高清:如果有人在考虑使用云使用NGS数据分析,存储和分发,则需要考虑许多事情。他们需要确定它们会生成多少数据,他们将执行哪些类型的分析,以及保留数据需要多长时间。在云中工作的费用涉及许可证的费用。它还包括存储和计算时间的成本。它让人们惊喜由ngs运行多少数据。他们没有意识到他们将收到FASTQ,BAM和VCF文件,其中占用云中的存储空间,增加成本。他们需要计算它们是否收到的福利超出了创建生物信息框架本身的成本。在我们的情况下,使用Basespace序列集线器是一种经济效益的分析方式,存储,管理和共享我们生成的NGS数据。购买服务器的成本,即使是我们的临床工作,雇用生物信息管理人员在目前的预算环境中对我们而言是对我们的成本持久。

信息治理也是一个问题。对于目标小组,我们获取的数据是匿名的,以保证患者的隐私。对于WGS服务来说,仍然存在保密问题。目前,我们正在通过获得参与者的同意来克服这个问题,但向前发展,这将是一个挑战。

问:您如何看待您的实验室未来的发展?

高清:我们正在创建更多有针对性的面板,并希望建立自己的私人临床WGS练习。我们正在为产前应用开发无细胞DNA工作和早期检测肿瘤和最小残留疾病(MRD)。我们还计划将WGS数据与RNA-SEQ集成。

问:您是否可以对Basespace序列集线器中的这些应用程序执行数据分析?

高清:我们在BaseSpace Sequence Hub中开发了一些分析管道。因为我们的企业账户为我们提供了24小时的生物信息学专业服务支持,我们将与Illumina合作开发几个新的BaseSpace应用程序。

yobet亚洲亚博官网人口了解本文中提到的Illumina系统和产品的更多信息:

Basespace序列集线器,www.169o.com/products/by-type/informatics-products/basespace- sequence-hub.html.

BaseSpace应用程序,www.169o.com/products/by-type/informatics-products/basespace-sequence-hub/apps.html

MiSeq系统,www.169o.com/systems/sequencing-platforms/miseq.html.

HiSeq系统,www.169o.com/systems/sequencing platforms/hiseq - 2500. - html

AmpliSeq for Illumina Custom DNA Panel(替代TruSeq Custom Amplicon),www.169o.com/products/by-type/sequencing-kits/library-prep-kits/ampliseq-custom-dna-panel.html

*TruSeq Custom Amplicon已停止。推荐的替代产品是Illumina定制DNA面板的AmpliSeq。

**BaseSpace Software是BaseSpace Suite的前身。