客户面试

可扩展的高通量阵列实现华人基因组数据库的开发

快速Infinium阵列分析和广泛的基因组覆盖支持个人基因检测服务和数据库开发。

可扩展的高通量阵列实现华人基因组数据库的开发

可扩展的高通量阵列实现华人基因组数据库的开发

简介

没有两个人在基因上是完全相同的,无论他们来自同一地区、种族或家庭。人类基因组测序有助于我们理解基因在人类疾病中所起的作用,以及环境、饮食和行为对人类健康基因的影响。它还揭示了不同种族之间独特的基因差异。WeGene是一家个人基因检测和人口基因组学公司,总部位于中国深圳,致力于了解东亚人群,特别是中国族裔之间的这些差异。除了向消费者提供基因检测服务外,它还正在创建一个东亚基因组数据库,以支持全球研究中心的人类基因组研究和个性化医疗方法的开发。

自2015年成立以来,WeGene迅速发展了个人基因检测服务,其结果数据构成了其东亚数据库的基础。该数据库包含> 20万条消费者数据,其中中国样本贡献了大部分数据。为了让中国客户更好地了解他们独特的基因特征和完整的祖先分析,WeGene正在扩大数据库,以包括更多的中国民族。由于该公司过渡到Infinium全球筛查阵列和iScan™系统解决方案,以实现更高的吞吐量和更广泛的基因组覆盖,该数据库预计将以每月15,000个数据块的速度增长。为了扩大实验室规模并提高工作流程效率,WeGene与Illumina Array Lab Services合作。

iccommunity采访了WeGene首席执行官郑强和首席技术官陈刚博士,讨论了WeGene个人基因检测服务的快速增长,其中国民族数据库的价值不断增加,以及下一代测序(NGS)在未来基因检测产品和服务发展中的作用。

郑强是中国深圳WeGene的首席执行官,陈刚博士是首席技术官。

问:WeGene的重点和使命是什么?

郑强(QZ):作为东亚地区最成功的个人基因检测公司之一,WeGene通过在线渠道营销和特别活动为客户提供直接面向消费者(DTC)的检测服务。我们的使命是利用我们通过检测服务收集的基因数据,为人类健康、疾病研究和药物开发,特别是针对中国少数民族人群提供新的启示。

问:中国DTC基因检测市场现状如何?

求出:中国的DTC市场正在蓬勃发展。虽然获得基因检测服务的人口比例仍然很小,但消费者的兴趣正在迅速增长。有许多公司进入这个市场,因为它的潜力。

问:WeGene提供哪些类型的测试服务?

求出:我们为客户提供数据驱动的、基于科学的祖先遗传评估,以及过敏的健康筛查等。我们整合DNA和表型数据,深入探索和研究数据。每个客户都会收到一份报告,其中概述了科学基础、研究结果和相应的研究方法。我们一起检查结果,以确定这些信息对他们有多大帮助。

我们客户提供的生活方式、表型和基因型数据构成了我们不断增长的基因组数据库的基础,该数据库覆盖了所有56个中国民族和其他几个东亚人群。我们的目标是为这些亚洲人口建立最大的基因组数据库。我们与科研机构合作,使我们的中国客户能够参与各种与基因组相关的研究。

“我们的WeGene中国和东亚基因组数据库开发的目标是推动基因检测技术的应用和研究,造福于个人消费者,以及全球研究机构。”

问:为什么建立中国少数民族基因组数据库如此重要?

陈刚(GC):基因组技术对健康和医学研究的许多领域产生了重大影响。然而,目前可用的大部分基因组数据并非来自东亚人群,比如中国少数民族。不同人群的基因组之间存在着巨大的差异,影响着我们对这些人群的疾病表现、病程和预后的理解。积累中国和东亚人群的基因组数据并创建参考基因组对于开发成功的个性化治疗方法和诊断分析至关重要。

问:如何创建这个数据库?

GC:我们认为,在收集基因数据时,与客户直接互动非常重要。只有基因组数据的数据库的价值是有限的。直接与我们的中国客户沟通,使我们能够收集遗传、表型和行为数据,建立一个更全面的数据库。我们相信,这种类型的数据库将是推动中国人群基因组研究的最有价值的数据库。我们希望迅速扩大基因组数据库的规模,为中国和东亚人群的遗传研究和应用开发建立基础。

问:你们使用什么工具和方法为这些数据库获取基因数据?

GC:WeGene使用fda批准的唾液采样器,以确保其收集、运输和存储的质量。我们使用高通量芯片平台进行基因检测,并进行数据质量控制和imputation分析,以生成高质量的遗传数据,为我们的东亚和中国参考基因组提供信息。

问:你以前创建这些数据库的方法和系统有什么局限性?

求出:在公司成立初期,我们的测试量和增长率都很小。我们考虑了各种解决方案,包括Illumina Infinium串珠芯片和Affymetrix微阵列。我们最终选择了Affymetrix。

问:是什么促使你转向不同的阵列解决方案?

求出:经过两年的发展,我们的样本量明显增加。我们在快速处理这么多样品时遇到了生产问题。我们需要一个更高效的生产平台,提供高速和高质量的数据。

基于效率、质量和服务方面的考虑,我们选择了Illumina阵列解决方案。”

问:为什么选择Illumina阵列解决方案?

求出:我们测试和评估了几种基因检测解决方案。根据我们的样本量预测,中国DTC检测市场的增长估计和数据需求,我们的最佳选择是一个更高性能的基于阵列的平台。唯一的选择是Illumina阵列解决方案,包括Infinium全球筛查阵列(GSA)和iScan系统,以及另一家供应商的阵列解决方案。

在最终的评估中,我们获得了包括23andMe在内的几份海外参考资料,并研究了配件相关问题。我们得出的结论是,Illumina阵列解决方案非常稳定,在全球拥有重要的用户基础,并提供了强大的技术支持。它能够解决由于我们快速增加的样品测试量而加剧的生产积压、质量和效率问题。基于效率、质量和服务考虑,我们选择了Illumina阵列解决方案。

问:切换到Illumina工作流后,样品处理能力是否有所提高?

求出:使用Illumina阵列解决方案,我们的样品周转时间从7个工作日减少到3个工作日。这种显著的效率改进使我们的样品处理速度从每周< 2000个样品提高到每周15,000个样品。这是处理能力的显著提高。

问:使用Tecan液体处理解决方案自动化Illumina阵列工作流程的能力是一种优势吗?

求出:自动化阵列工作流程的能力是我最看重的Illumina阵列解决方案的优点之一。在处理大量样品方面,自动化是未来的关键问题。

问:Illumina阵列解决方案的数据质量达到了什么水平?

GC:我们与Illumina的研究、开发和生产团队合作,添加了某些标记,以创建各种定制的GSAs来满足我们的需求。即使我们要求包含许多额外的自定义标记,Illumina对这些阵列的合成也非常出色。这些定制的gsa提供了良好的稳定性、相关性和高数据质量。

使用Illumina阵列解决方案,我们的样品周转时间从7个工作日缩短到3个工作日。”

问:使用GSA进行基因检测的优势是什么?

GC:WeGene参与了早期GSA设计讨论。自从Broad研究所提出最初的设计方案以来,我们已经看到GSA在芯片设计理念和设计基础方面处于领先地位。

GSA在中国和世界各地的许多商业和科研机构中得到了应用,积累了大量的数据。在可预见的未来,这种数据积累的规模和速度将继续增加。这为WeGene提供了一个显著的优势,因为我们创建了我们的数据库,提供了与未来全球研究数据兼容的数据。在我们的消费者和科学研究中使用基于gsa的芯片使WeGene能够获得更好的结果,并增加了识别特定种族的疾病和健康相关标记的机会。

Illumina阵列解决方案生成的高质量数据也为我们的客户提供了价值。其他英菲尼姆个人基因组产品,如23andMe DTC测试的一些产品,已获得美国监管机构的批准。我们通过Infinium GSA和iScan系统进行个人基因组检测所获得的结果将支持我们在中国和其他地区获得监管部门的批准。Illumina阵列解决方案为我们的客户提供值得信赖和可靠的DTC基因检测。

问:您已经开始使用Illumina亚洲筛选阵列(ASA)了吗?

GC:我们还没开始使用助理检察官。我们将与Illumina合作,为中国少数民族定制ASA芯片,为未来WeGene基因检测产品的开发提供支持。

问:Illumina ArrayLab咨询服务在建立新的实验室工作流程方面提供了什么好处?

求出:Illumina ArrayLab咨询团队在规划和设计大规模生产实验室操作方面拥有丰富的经验。他们帮助我们建立设施设计,并确定高效工作流程所需的系统数量。从耗材的角度来看,我们与他们合作创建了一个生产阵列装运计划,以支持我们不断增加的样品量。ArrayLab团队还帮助我们确定人员配备和外部资源预测,以及可扩展的高性能实验室所需的自动化和过程控制需求。团队的经验和指导使我们能够避免在整个建设和开发过程中可能遇到的潜在问题,如果我们自己协调一切的话。ArrayLab咨询服务团队使我们能够以更快、更有效的方式开始在成熟的、已建立的模型上运行我们的实验室。

问:你使用什么软件管道进行数据分析?

求出:Illumina协助我们设计了一个高通量分析软件管道。我们优化了Illumina为我们大规模基因组数据工厂提供的标准数据分析管道。为了有效地处理我们产生的数据,大量的计算节点是必要的。我们还开发了几个云组件来实现数据的分析和解释。

ArrayLab咨询服务团队使我们能够以更快、更有效的方式在成熟、成熟的模型上运行我们的实验室。”

问:你们是否正在评估NGS用于基因检测的发展,以扩大DTC产品的供应?

GC:我们专注于为客户提供最新的基因检测技术和最佳的检测方法。为了获得全面的个人基因组数据,我们需要对整个基因组进行测序。利用NGS,特别是全基因组测序(WGS)开发新的基因检测产品,将使我们能够为客户提供更好、更有信息量的个人基因组检测和分析服务。由于WGS分析的是整个基因组而不是单个基因,因此它对遗传变异进行了更深入的评估。

我们在WGS试点研究中使用了最新的测序系统,包括NovaSeq™6000系统。通过与全球各组织的学术研究团队合作,我们正在对数千个客户的全基因组序列进行数据分析和管理。

初步研究的测序结果令人印象深刻。WGS提供的信息比数组多得多。我们向参与研究的客户提供他们的WGS VCF文件,以便他们将其提交给第三方数据分析公司进行分析。例如,有提供基于Y染色体的数据分析结果的服务。除了原始序列数据,我们还包括用于确定细胞年龄的端粒长度数据,以及其他相关分析结果。

我们试点研究的WGS数据将用于进一步开发我们定制的个人基因组芯片,用于亚洲人群的基因检测。结合数组赋值和质量控制数据,它将使我们能够进一步改进我们的定制数组。

问:NovaSeq 6000系统在这些研究中的表现如何?

GC:NovaSeq 6000系统是世界上最先进的测序平台之一,具有令人印象深刻的性能、数据质量和稳定性。

问:NGS如何对DTC业务产生积极影响?

GC:我们相信,随着技术的进步和测序成本的降低,NGS最终将成为个人基因组检测的主流技术。这就是为什么我们正在进行必要的研究和开发,以提高我们今天的NGS技术能力。我们研究的NGS数据将有利于我们的中国和东亚数据库开发,改善我们基于gsa的产品,并作为下一代WeGene个人基因组检测服务的基础。我们将继续与各个研究领域的科学家进行深入研究,以挖掘NGS全基因组测序数据的好处。

“我们相信,随着技术的进步和测序成本的降低,NGS最终将成为个人基因组检测的主流检测技术。”

问:NGS数据如何有助于数据库的进一步发展?

GC:我们的目标是推动基因检测技术的应用和研究,以造福个人消费者和全球研究机构。NGS技术促进了整个基因组的检测,为我们提供了详细的遗传信息,如结构变异、拷贝数变异和罕见突变的存在。这些数据对于研究癌症、自闭症和罕见疾病的学术研究人员来说非常有价值。

我们相信,如果我们将NGS技术全面、大规模地应用于个人基因组产品,我们可以将这些学术领域的研究成果迅速造福于个人消费者。个人消费者的数据将反过来刺激基因组数据库的研究。

问:WeGene在扩大DTC业务方面的下一步计划是什么?

求出:我们希望迅速扩大用户群。根据我们的预测,我们预计2019年用户将达到100万,五年内用户将超过2000万。我们将继续向中国、东亚和全球的潜在客户推广和教育WeGene的服务。我们将继续寻求研究伙伴关系,以提高我们的消费者基因检测服务以及中国少数民族和东亚基因组数据库的价值和效用。

问:Illumina的产品、系统和服务将如何支持这些目标?

求出:Illumina的产品、系统和服务将有助于降低成本,提高测试效率,并通过智能自动化系统实现更高的生产效率,以扩展我们的生产和分析服务。

yobet亚洲亚博官网人口了解更多关于本文中提到的产品和系统的信息:

Infinium全球筛选阵列(GSA)

亚洲放映阵列(ASA)

iScan系统

NovaSeq 6000系统