跳到内容

Enancio

Enancio科技加入Illumina家族

降低与大数据相关的基因组数据存储和传输成本

无损基因组压缩首次在仪器上可用

DRAGEN ORA(以前是Enancio的Lena)无损基因组压缩现在可与NextSeq 1000/2000测序系统和DRAGEN服务器v3.8联机使用。

yobet亚洲亚博官网人口了解更多关于NextSeq 1000/20000
yobet亚洲亚博官网人口了解更多关于DRAGEN的信息
Enancio标志

基因组数据压缩的好处

Illumina致力于提供创新的测序技术,并帮助客户管理由于测序研究的激增而产生的越来越多的数据输出。Enancio的基因组数据压缩技术,现在被称为DRAGEN ORA(原始阅读档案)压缩,提供了最佳的速度和效率水平,很好地补充了Illumina的其他信息解决方案。

基因组数据压缩允许:

  • 降低存储成本
  • 高速文件传输
  • 减少内部网络流量

无损基因组数据压缩技术

Enancio的无损基因组数据压缩技术通过压缩Illumina测序仪的输出,将数据存储空间减少了多达5倍。Enancio技术使用基于参考的压缩方法。他们的想法是使用一种超快的映射方案将读取的数据映射到参考基因组上,然后只存储重新生成这些读取所需的数据:位置和差异列表。

其他数据压缩技术通常速度较慢。Enancio技术为高压缩比,以及快速压缩和解压率而优化,同时保持数据完整性。质量分数使用范围编码器和适应不同类型质量方案的上下文模型以无损的方式进行编码。

访问DRAGEN ORA解压软件

使用Illumina压缩技术压缩的所有文件都可以使用可用的解压软件轻松解压在这里解压软件可以免费下载和使用。

安装完成后,可以使用一个简单的命令将解压缩的输出直接管道传输到各种流行的映射工具,如BWA、STAR和Bowtie。压缩和解压技术也将无缝集成到DRAGEN二级分析工作流程中。

立即下载

Enancio是Illumina最近收购的一家公司,拥有专门为基因组数据设计的专有无损数据压缩技术。

DRAGEN ORA无损压缩是专门为基因组学数据设计的。DNA序列是用基于参考的方法压缩的:reads是用一种为压缩设计的超快映射方案映射到参考基因组上的。一种紧凑的二进制格式用于将读码编码为位置和差异列表,然后是熵编码器。质量分数使用范围编码器和适应不同类型质量方案的上下文模型以无损的方式进行编码。

DRAGEN ORA压缩技术将FASTQ文件的数据占用减少了5倍1而gzip。这转化为直接存储成本的节省和更快速的文件传输速度。

压缩技术将分阶段集成到Illumina的产品组合中,用户可以选择制作比FASTQ .gz1小5倍的FASTQ压缩文件。压缩在NextSeq 1000/2000上已经可用。从v3.8版开始,DRAGEN服务器上也将提供压缩,并将压缩FASTQ文件导入DRAGEN映射器。

在NGS工作流中,你可以选择启用压缩来生成压缩的fastq。ora文件。随着DRAGEN v3.8的发布,fastq。ora文件可以直接通过DRAGEN映射器进行无缝集成。fastq。Ora文件也可以动态解压缩,以用于其他映射和下游分析。DRAGEN BCL转换中的压缩集成简化了工作流程,如下图所示:

ORA压缩技术在DRAGEN内使用
在收购Enancio之前:压缩作为一个独立的软件。压缩是一个额外的步骤。

压缩技术的输出是一种新的压缩FASTQ二进制文件格式:FASTQ .ora。这种文件格式可以存储和共享,以显著节省存储成本和减少文件传输时间。所有压缩文件都可以用免费提供的解压软件

Fastq。ora文件可以动态解压缩,用于映射和下游分析,并将很快被DRAGEN直接摄取。

一个235gb的FASTQ原始文件可以通过gzip压缩到55gb。使用DRAGEN ORA压缩技术,数据占用进一步减少到11 GB2

Fastq文件和BAM或CRAM文件的存储通常是出于不同的目的。然而,fastq。ora文件使您能够存储原始数据的压缩副本与保存的MD5和更小的占用比相应的CRAM文件。

DRAGEN现在可以启用两种不同格式的压缩:FASTQs和BAMs到fastq。ora和CRAM。

压缩的利用是完全可选的。DRAGEN用户仍然可以自由地采用他们想要的存储策略:激活转换为Illumina FASTQ压缩文件格式并存储这些文件,禁用转换为DRAGEN ORA压缩文件格式FASTQ。或存储BAM或CRAM文件。

是的。随着DRAGEN 3.8发布,压缩是完全无缝和压缩fastq。ora文件被直接导入DRAGEN映射器。

此外,一旦免费的压缩软件,可以使用一个简单的命令直接将解压缩的输出动态管道输送到广泛的流行映射工具,如BWA3.,明星4,领结5

DRAGEN ORA FASTQ支持共享FASTQ压缩文件。的解压缩软件是免费的。一旦安装了免费的解压缩软件,就可以使用一个简单的命令直接将解压缩的输出传送到各种流行的映射工具,如BWA3.,明星4,领结5

对压缩技术有疑问吗?

yobetesports联系我们了解更多。亚博官网人口yobet亚洲

DRAGEN看到你的平台

Enancio的基因组数据压缩技术将直接集成到DRAGEN中,为测序数据提供精确、超快速的二级基因组分析。

亚博官网人口

相关解决方案

基础设施和管道设置

我们提供各种资源和信息,以帮助简化建立您的信息基础设施的过程。

测序数据分析

我们的排序数据分析软件帮助您花更多的时间做研究,更少的时间配置和运行分析工作流程。

Illumina信息学产品组合

探索广泛的信息学产品,旨在简化基因组数据分析和管理。

参考文献
  1. 由NextSeq 1000/2000和NovaSeq 6000系统生成的文件
  2. 这一结果是由在NovaSeq 6000仪器上测序的NA12878 DNA样本获得的,其覆盖面积为30倍。在BaseSpace项目中可以访问数据:basespace.illumina.com/s/3ExEZMlH8Lkq
  3. 基于burrowwheeler变换的快速、准确的短读对齐。生物信息学。2009年7月15日;25(14): 1754 - 1760。
  4. 杜宾等。STAR:超快通用rna测序仪。生物信息学。2013年1月;29(1): 15至21。
  5. 兰米德等。短DNA序列与人类基因组的超快和记忆效率比对。基因组生物学2009 10:R25