跳到内容

Enancio

Enancio科技加入Illumina家族

降低与大数据相关的基因组数据存储和传输成本

首次在仪器上提供无损基因组压缩

DRAGEN ORA(以前是Enacio的Lena)无损基因组压缩现在可在NextSeq 1000/2000测序系统的仪器上以及DRAGEN服务器v3.8上使用。

yobet亚洲亚博官网人口了解更多关于NextSeq 1000/20000
yobet亚洲亚博官网人口了解更多关于DRAGEN的信息
Enancio标志

基因组数据压缩的好处

Illumina致力于提供创新的测序技术,并帮助客户管理测序研究激增所带来的不断增长的数据输出量。Enacio的基因组数据压缩技术,现在被称为DRAGEN ORA(原始读取存档)压缩,提供了最佳的速度和效率,并很好地补充了其他Illumina信息学解决方案。

基因组数据压缩允许:

  • 降低存储成本
  • 高速文件传输
  • 减少内部网络流量

无损基因组数据压缩技术

Enancio的无损基因组数据压缩技术通过压缩Illumina测序仪的输出,将数据存储空间减少了多达5倍。Enancio技术使用基于参考的压缩方法。他们的想法是使用一种超快的映射方案将读取的数据映射到参考基因组上,然后只存储重新生成这些读取所需的数据:位置和差异列表。

其他数据压缩技术通常速度较慢。Enancio技术为高压缩比,以及快速压缩和解压率而优化,同时保持数据完整性。质量分数使用范围编码器和适应不同类型质量方案的上下文模型以无损的方式进行编码。

访问DRAGEN ORA解压软件

使用Illumina压缩技术压缩的所有文件都可以使用可用的解压缩软件轻松解压缩在这里.解压软件可以免费下载和使用。

安装后,可以使用一个简单的命令直接将动态解压缩的输出传输到各种流行的映射工具中,如BWA、STAR和Bowtie。压缩和解压缩技术也将无缝集成到DRAGEN二次分析工作流程中。

现在下载

Enacio是Illumina最近收购的一家公司,拥有专为基因组数据设计的专有无损数据压缩技术。

DRAGEN ORA无损压缩是专门为基因组学数据设计的。DNA序列是用基于参考的方法压缩的:reads是用一种为压缩设计的超快映射方案映射到参考基因组上的。一种紧凑的二进制格式用于将读码编码为位置和差异列表,然后是熵编码器。质量分数使用范围编码器和适应不同类型质量方案的上下文模型以无损的方式进行编码。

DRAGEN ORA压缩技术将FASTQ文件的数据占用空间减少了5倍1.与gzip相比。这转化为直接的存储成本节约和更快的文件传输速度。

压缩技术将分阶段集成到Illumina产品组合中,用户可以选择生成比FASTQ.gz1小5倍的压缩FASTQ文件。压缩功能已在NextSeq 1000/2000上提供。从v3.8版本开始,DRAGEN服务器上也将提供压缩,并将压缩的FASTQ文件本机接收到DRAGEN映射器中。

在NGS工作流期间,您可以选择启用压缩以生成压缩的fastq.ora文件。在DRAGEN v3.8版本中,DRAGEN mapper可以直接接收fastq.ora文件,实现无缝集成。还可以动态解压缩fastq.ora文件,用于其他映射和下游分析。DRAGEN BCL转换中的压缩集成简化了工作流程,如下图所示:

DRAGEN中使用的ORA压缩技术
在收购Enancio之前:压缩作为一个独立的软件。压缩是一个额外的步骤。

压缩技术的输出是一种新的压缩FASTQ二进制文件格式:FASTQ.ora。可以存储和共享此文件格式,以显著节省存储成本并缩短文件传输时间。所有压缩文件都可以使用免费提供的解压软件.

ora文件可以动态解压缩以进行映射和下游分析,很快就会被DRAGEN直接接收。

一个235gb的FASTQ原始文件可以通过gzip压缩到55gb。使用DRAGEN ORA压缩技术,数据占用进一步减少到11 GB2..

Fastq文件和BAM或CRAM文件的存储通常是出于不同的目的。然而,fastq。ora文件使您能够存储原始数据的压缩副本与保存的MD5和更小的占用比相应的CRAM文件。

DRAGEN现在可以启用两种不同格式的压缩:FASTQs和BAMs到fastq。ora和CRAM。

压缩的利用是完全可选的。DRAGEN用户仍然可以自由地采用他们想要的存储策略:激活转换为Illumina FASTQ压缩文件格式并存储这些文件,禁用转换为DRAGEN ORA压缩文件格式FASTQ。或存储BAM或CRAM文件。

对在DRAGEN 3.8版本中,压缩是完全无缝的,压缩后的fastq.ora文件被直接导入DRAGEN mapper。

此外,一旦免费的压缩软件,可以使用一个简单的命令直接将解压缩的输出动态管道输送到广泛的流行映射工具,如BWA3.,明星4.,领结5..

DRAGEN ORA FASTQ支持共享FASTQ压缩文件。的解压软件是免费的。一旦安装了免费的解压缩软件,就可以使用一个简单的命令直接将解压缩的输出传送到各种流行的映射工具,如BWA3.,明星4.,领结5..

对压缩技术有疑问吗?

yobetesports请与yobet亚洲亚博官网人口我们联系以了解更多信息。

德拉根生物信息技术平台

Enacio的基因组数据压缩技术将直接集成到DRAGEN中,DRAGEN可对测序数据进行准确、超快速的二级基因组分析。

亚博官网人口

相关解决方案

基础设施和管道设置

我们提供各种资源和信息,以帮助简化设置信息学基础架构的过程。

测序数据分析

我们的排序数据分析软件帮助您花更多的时间做研究,更少的时间配置和运行分析工作流程。

Illumina信息学产品组合

探索一系列旨在简化基因组数据分析和管理的信息学产品。

工具书类
  1. 关于NextSeq 1000/2000和NovaSeq 6000系统生成的文件
  2. 该结果来自于在NovaSeq 6000仪器上测序的DNA样本NA12878,覆盖率为30倍。可以在BaseSpace项目上访问数据:basespace.illumina.com/s/3ExEZMlH8Lkq.
  3. Li H.和Durbin R.使用Burrows–Wheeler变换进行快速准确的短读对齐。生物信息学。2009年7月15日;25(14): 1754–1760.
  4. Dobin A.等人STAR:超快通用RNA序列比对器。生物信息学。2013年1月;29(1): 15–21.
  5. Langmead B.等人。短DNA序列与人类基因组的超快和高效记忆比对。基因组生物学2009 10:R25