如何将自定义BED文件转换为清单文件以进行扩展分析

02/19/20


提供Illumina富集分析工作流程,包括基空间序列集线器本地运行管理器米塞克记者,可以使用Illumina固定面板清单来指定变量调用的目标区域,或者使用自定义清单文件。通过Illumina创建的Illumina定制面板提供了舱单设计工作室.或者,许多非illumina供应商提供床上文件来定义需要转换为清单的目标区域。如下图所示,虽然BED文件(顶部)和manifest文件(底部)的内容相似,但manifest文件有不同的格式和一些额外的信息。这些例子摘自快速捕获扩展外显子组内容设置。

要将BED文件转换为浓缩清单文件,请执行以下步骤:

  1. 下载快速捕获扩展外显子组Manifest作为模板使用。保留[标题]部分,包括到参考基因组的路径。
  2. (地区)节中,将任何目标名称从BED文件的第4列复制到清单文件的“名称”列(第1列)。有关更多指导,请参阅下面的“重要注意事项”。
  3. 将BED文件的第一列、第二列和第三列分别复制到清单文件的第二列、第三列和第四列(即,开始、结束)。
  4. 如果上游和下游探针长度由供应商提供,它们可以包括在下两列。如果没有提供这些值,则将这些值设置为0。
  5. 另存为制表符分隔的文本文件(TSV),而不是CSV或Excel。

重要的注意事项

  • 目标名称必须唯一。为了确保名称是惟一的,可以用一系列数值附加它们,例如Target.001、Target.002、Target.003。
  • 目标名称中只允许使用字母、数字、句点、破折号和下划线。不允许使用空格和特殊字符(例如但不限于:和)。请删除包含<>符号中包含的曲目信息的任何行。
  • 导入到BaseSpace Sequence Hub时,不唯一的目标名称或使用不支持的字符将返回错误消息“[Probes]部分缺失或无效”。虽然富集清单文件不需要[Probes]部分,但此消息表明文件格式无效。
  • 将清单文件导入BaseSpace Sequence Hub时,大小大于30 MB的文件可能无法通过验证步骤。