跳到内容

Enancio

Enacio technology加入Illumina家族

降低与大数据相关的基因组数据存储和传输成本

Enancio标志

基因组数据压缩的好处

Illumina致力于提供创新的测序技术,并帮助客户管理由于测序研究的激增而产生的越来越多的数据输出。Enancio的基因组数据压缩技术提供了最佳的速度和效率水平,很好地补充了Illumina的其他信息解决方案。

基因组数据压缩允许:

  • 降低存储成本
  • 高速文件传输
  • 减少内部网络流量

无损基因组数据压缩技术

Enancio的无损基因组数据压缩技术通过压缩Illumina测序仪的输出,将数据存储空间减少了多达5倍。Enancio技术使用基于参考的压缩方法。他们的想法是使用一种超快的映射方案将读取的数据映射到参考基因组上,然后只存储重新生成这些读取所需的数据:位置和差异列表。

其他数据压缩技术通常存在速度慢的问题。Enacio技术针对高压缩比以及快速压缩和解压缩速率进行了优化,同时保持了数据完整性。使用范围编码器和适应不同类型质量方案的上下文模型,以无损方式对质量分数进行编码。

访问Enancio解压软件

使用Illumina压缩技术压缩的所有文件都可以使用此处提供的解压软件轻松解压。解压软件可以免费下载和使用。

安装完成后,可以使用一个简单的命令将解压缩的输出直接管道输送到各种流行的映射工具,如BWA、STAR和BowTie。压缩和解压技术也将无缝集成到DRAGEN二级分析工作流程中。

立即下载

Enacio是Illumina最近收购的一家公司,拥有专为基因组数据设计的专有无损数据压缩技术。

Enancio(现在Illumina)的无损压缩是专门为基因组学数据设计的。DNA序列是用基于参考的方法压缩的:reads是用一种为压缩设计的超快映射方案映射到参考基因组上的。一种紧凑的二进制格式用于将读码编码为位置和差异列表,然后是熵编码器。质量分数使用范围编码器和适应不同类型质量方案的上下文模型以无损的方式进行编码。

Illumina的压缩技术将fastq文件的数据占用减少了5倍1而gzip。这转化为直接存储成本的节省和更快速的文件传输速度。

压缩技术将首先集成到DRAGEN BCL转换中,使用户可以选择生成比fastq.gz小5倍的fastq压缩文件1

NextSeq 1000/2000具有压缩技术,可以在仪器上立即生成压缩的fastq文件。请继续关注未来的DRAGEN发布,它将包括作为BCL转换的一部分的fastq文件的无损基因组压缩

在NGS工作流程中,您可以选择启用压缩以在BCL转换期间生成压缩的fastq.ora文件。fastq.ora文件可以动态解压缩以进行映射和下游分析,并且很快将由DRAGEN直接接收。DRAGEN BCL转换中的压缩集成简化了工作流程,如图所示如下图所示:

DRAGEN中使用的Illumina压缩技术
在Enancio收购之前:压缩作为一个独立的软件。压缩是一个额外的步骤。

压缩技术输出的是一种新的压缩fastq二进制文件格式:fastq.ora。这种文件格式可以存储和共享,以显著节省存储成本和减少文件传输时间。所有压缩文件都可以用免费提供的解压软件

ora文件可以动态解压缩以进行映射和下游分析,很快就会被DRAGEN直接接收。

一个235gb的fastq文件可以通过gzip压缩到55gb。通过Illumina压缩技术,数据占用进一步减少到11 GB2

Fastq文件和BAM或CRAM文件通常存储用于不同的目的。但是,fastq.ora文件使您能够存储原始数据的压缩副本,并保留MD5总和,占用空间小于相应的CRAM文件。

DRAGEN已经可以为BAM文件生成CRAM压缩。一旦Enancio压缩集成到DRAGEN,您将能够压缩Fastqs和BAMs到fastq。ora和CRAM。

压缩的使用是完全可选的。DRAGEN用户可以自由地采用他们想要的存储策略:激活到Illumina fastq压缩文件格式的转换并存储这些文件,禁用到Illumina压缩文件格式fastq.ora的转换并存储fastq.gz,或者存储BAM或CRAM文件。

是–压缩技术将无缝集成到DRAGEN工作流程中。

此外,一旦免费解压软件安装后,可以使用一个简单的命令将解压缩的输出直接通过管道传输到各种流行的映射工具(如BWA)中3.,明星4、和领结5

可以共享Illumina fastq压缩文件。的解压缩软件是免费的。一旦安装了免费的解压缩软件,就可以使用一个简单的命令直接将解压缩的输出传送到各种流行的映射工具,如BWA3.,明星4、和领结5

对压缩技术有疑问吗?

yobetesports联系我们了解更多。亚博官网人口yobet亚洲

DRAGEN看到你的平台

Enacio的基因组数据压缩技术将直接集成到DRAGEN中,DRAGEN可对测序数据进行准确、超快速的二级基因组分析。

亚博官网人口

相关解决方案

基础设施和管道设置

我们提供各种资源和信息,以帮助简化设置信息学基础架构的过程。

测序数据分析

我们的测序数据分析软件可以帮助您花费更多的时间进行研究,减少配置和运行分析工作流的时间。

Illumina信息产品组合

探索广泛的信息学产品,旨在简化基因组数据分析和管理。

参考文献
  1. 关于NextSeq 1000/2000和NovaSeq 6000系统生成的文件
  2. 这一结果是由在NovaSeq 6000仪器上测序的NA12878 DNA样本获得的,其覆盖面积为30倍。在BaseSpace项目中可以访问数据:basespace.illumina.com/s/3ExEZMlH8Lkq
  3. 基于burrowwheeler变换的快速、准确的短读对齐。生物信息学。2009年7月15日;25(14): 1754 - 1760。
  4. 杜宾等。STAR:超快通用rna测序仪。生物信息学。2013年1月;29(1): 15至21。
  5. Langmead B.等人。短DNA序列与人类基因组的超快和高效记忆比对。基因组生物学2009 10:R25