跳转到内容

南西奥

Enancio技术加入Illuma

减少与大数据相关联的基因组数据存储和传输费用

南西奥Logo

基因组数据压缩的好处

Illuma致力于提供创新排序技术,帮助客户管理数量不断扩大的数据输出量,这些数据输出量因顺序基础研究扩散而增加Enancio的基因组数据压缩技术提供最优速度和效率水平,并很好地补充其他Illuma信息学解决方案

基因组数据压缩允许:

  • 较低的存储费用
  • 高速文件传送
  • 内部网络流量下降

无损基因组压缩技术

Enancio无损基因组压缩技术压缩Illuma测序器输出量,使数据存储足迹减少五倍Enancio技术使用参考压缩法概念是使用超快映射图读取参考基因组,然后只存储重生数据所需要数据:位置和差分列表

数据压缩技术通常受低速度影响Enancio技术优化高压缩率以及快速压缩和解压缩率,同时保留数据完整性质量评分用测距编码器和上下文模型无损编码适应不同类型的质量方案

存取Enancio解压缩软件

使用Illuma压缩技术压缩的所有文件很容易使用这里可用的解压缩软件解压缩解压缩软件免费下载使用

安装后可使用简单命令直接管道解压缩飞流入广受欢迎的映射工具,如BWA、STAR和BowTie压缩解压缩技术也将无缝融入DRAGEN二次分析工作流

立即下载

Enancio公司最近由Ilumina获取专有无损数据压缩技术专为基因组数据设计

enicio无损压缩专为基因组学数据设计The DNA sequence is compressed using a reference-based method: reads are mapped on a reference genome using an ultra-fast mapping scheme devised for compression.A compact binary format is used to encode reads as positions and a list of differences, followed by an entropy coder.Quality scores are encoded in a lossless way using a range encoder and context models adapted to the different types of quality schemes.

光素压缩技术将快克文件数据足迹减少5倍一号对比gzip转化成直接存储成本节约和更快速文件传送速度

The compression technology will first be integrated into DRAGEN BCL conversion, giving users the option to produce compressed fastq files that are 5x smaller than fastq.gz一号.

NextSeq1000/2000上提供压缩技术,从仪表上生成压缩快q文件Stay tuned for future DRAGEN releases that will include lossless genomic compression of fastq files as part of BCL Conversion

NGS工作流期间,您可任选启动压缩生成压缩快q.ora文件Fastq.ora files can be decompressed on the fly for mapping and downstream analysis and will soon be directly ingested by DRAGEN.The integration of compression within DRAGEN BCL conversion streamlines the workflow, as shown in the figure below:

光素压缩技术
Enancio获取前:压缩为单机软件压缩是一个额外步骤

压缩技术输出新压缩快二叉文件格式:快q.ora文件格式可存储共享,以便节省存储费用并减少文件传送时间所有压缩文件都可用免费解压缩软件.

fastq.ora文件可解压缩飞线映射和下游分析,不久将直接由DRAGEN取用

235GB原快克文件可以通过gzip压缩为55GBThe data footprint is further reduced to 11 GB with the Illumina compression technology2.

fastq文件和BAM或CRAM文件通常为不同目的存储However, fastq.ora files enable you to store a compressed copy of your raw data with a preserved MD5 sum and smaller footprint than the corresponding CRAM file.

DRAGEN系统已生成 CRAM压缩bAM文件Once the Enancio compression is integrated into DRAGEN, you will be able to compress Fastqs and BAMs to fastq.ora and CRAM respectively.

压缩使用完全可选DRAGEN users remain free to adopt the storage strategy they want: activate the conversion to Illumina fastq compressed file format and store these files, disable the conversion to Illumina compressed file format fastq.ora and store fastq.gz, or store BAM or CRAM files.

压缩技术将无缝融入DRAGEN工作流

此外 曾免费解压缩软件is installed, a simple command can be used to directly pipe the output of decompression on the fly into a wide range of popular mapping tools such as BWA3星际大战4和波台5.

光照快速压缩文件可共享上头解压缩软件可免费获取Once the free decompression software is installed, a simple command can be used to directly pipe the output of decompression on the fly into a wide range of popular mapping tools such as BWA3星际大战4和波台5.

关于压缩技术有问题吗

yobetesports联系我们学习更多

DRAGEN生物IT平台

Enancio的基因组数据压缩技术将直接融入DRAGEN系统,DRAGEN系统提供精密超快速二级基因组分析测序数据

亚博官网人口

相关解决方案

基础设施管道搭建

我们提供各种资源和信息帮助简化建立信息学基础程序

顺序数据分析

测序数据分析软件帮助你花更多时间进行研究,减少时间配置并运行分析工作流

光照信息产品组合

探索各种信息学产品,以简化基因组数据分析管理

引用
  1. NextSeq1000/2000和NovaSeq600系统生成文件
  2. 从NavaSeq6000仪上NavaSeq6000样本测序并覆盖30xBaseSpace项目提供数据basespace.illumina.com/s/3ExEZMlH8Lkq.
  3. 李赫和Durbin R快速精确阅读匹配Burrows-Wheeler变换生物信息学7月15日2514:1754-1760
  4. 道宾Aet al.超快通用RNA等值编译器生物信息学2013年1月29(1):15-21
  5. 兰米德Bet al.超快和内存高效匹配短脱氧核糖核酸序列基因组生物学200910:R25