可扩展的高通量阵列使华人基因组数据库开发成为可能
介绍
没有两个人的基因是完全相同的,无论他们是来自相同的地区、种族或家庭。人类基因组测序有助于我们理解遗传学在人类疾病中的作用,以及环境、饮食和行为对人类健康遗传学的影响。它还揭示了不同种族间独特的遗传差异。总部位于中国深圳的WeGene是一家个人基因测试和人口基因组学公司,该公司利用了解东亚人群(尤其是中国族裔)之间的这些差异的价值。除了向消费者提供基因检测服务,该公司还在创建一个东亚基因组数据库,以支持人类基因组研究和全球研究中心的个性化医疗方法的开发。
自2015年成立以来,Wegene已经迅速增长了其个人遗传测试服务,从而形成了其东亚数据库的基础。数据库包含> 200,000件消费者数据,具有中文样本贡献大部分数据。为其中国客户提供了更好地了解他们独特的遗传型材和完整的祖先分析,Wegene正在扩展数据库,包括更多的中国民族。由于公司的过渡到Infinium全球筛选阵列和ISCAN™系统解决方案,因此预计该数据库将以每月增长> 15,000个数据件,以实现更高的吞吐量和更广泛的基因组覆盖。为了规模其实验室和增加工作流程效率,Wegene与Illumina阵列实验室服务合作。
iCommunity spoke with Qiang Zheng, Chief Executive Officer, and Gang Chen, PhD, Chief Technology Officer about the rapid growth of WeGene’s person genetic testing services, the increasing value of its Chinese ethnic database, and the role next-generation sequencing (NGS) will play in the development of its future genetic testing products and services.
郑强是中国深圳WeGene的首席执行官,陈刚博士是首席技术官。
问:Wegene的重点和使命是什么?
羌族郑(求):作为东亚最成功的个人遗传检测公司之一,Wegene通过在线渠道营销和特殊活动为客户提供直接消费者(DTC)测试服务。我们的使命是利用我们通过测试服务聚集的遗传数据,以闪耀对人类健康,疾病研究和药物开发的新光线,特别是对于中国民族人口。
问:中国DTC基因检测市场的地位是什么?
QZ:中国的直接转矩控制市场正蓬勃发展。虽然获得基因检测服务的人口比例仍然很小,但消费者的兴趣正在迅速增长。由于其潜力,有许多公司进入该市场。
问:Wegene提供哪些类型的测试服务?
QZ:我们为客户提供数据驱动的,有科学依据他们的祖先遗传评估,以及健康筛查过敏等我们整合DNA和表型数据,探测和深入研究的数据。每个客户收到概括了科学依据,研究成果,以及相应的研究方法的报告。总之,我们审查结果,以确定这些信息如何帮助别人是他们。
生活方式,表型和基因型数据,我们的客户提供形成了我们成长的基因组数据库,涵盖了所有中国56个民族和其他一些东亚人群的基础。我们的目标是打造规模最大的基因组数据库,为这些亚洲人群。科研机构,使我们的中国客户,我们的合作伙伴参与各种基因组相关研究报告。
“我们的Wegene中国民族和东亚基因组数据库发展的目标是推动基因检测技术的应用和研究,使个人消费者的利益,以及全球研究组织。”
问:为什么建立中国民族基因组数据库如此重要?
陈刚(GC):基因组技术对许多健康和医学研究的影响产生了重大影响。然而,今天的大多数基因组数据不是来自中国民族的东亚人口,如中国民族。不同人口群体的基因组之间存在显着变化,影响我们对这些群体内的疾病介绍,过程和预后的理解。积累中东亚洲人群的基因组数据,创建参考基因组对成功的个性化治疗方法和诊断测定的发展至关重要。
问:您如何创建此数据库?
GC:我们认为,在收集基因数据时,与客户直接互动非常重要。只有基因组数据的数据库的价值是有限的。直接与中国客户沟通,使我们能够收集遗传、表型和行为数据,建立一个更全面的数据库。我们相信,这种类型的数据库将是最有价值的驱动中国人口群体基因组研究。我们希望快速扩大我们的基因组数据库规模,建立一个支持中国和东亚人群基因研究和应用开发的基金会。
问:你用什么样的工具和方法来获取这些数据库的基因数据?
GC:Wegene使用FDA批准的Saliva采样器,以确保其收集,运输和存储的质量。高吞吐量微阵列平台用于基因检测,我们执行数据质量控制和归纳分析,以产生高质量的遗传数据,以通知我们的东亚和中国民族参考基因组。
问:您以前用于创建这些数据库的方法和系统有哪些局限性?
QZ:在公司成立后的早期,我们的测试量和增长率很小。我们考虑了各种解决方案,包括Illumina Infinium Beadchip和Affymetrix微阵列。我们最终选择了yefymetrix。
问:是什么促使你转向不同的阵列解决方案?
QZ:经过两年的开发,我们的样本量显著增加。我们在快速处理这么多样品时遇到了生产问题。我们需要一个更高效的生产平台,提供高速和数据质量。
“基于效率、质量和服务方面的考虑,我们选择了Illumina阵列解决方案。”
问:你为什么选择illumina阵列解决方案?
QZ:我们测试和评估几种遗传测试解决方案。根据我们的样本量的预测,增长预期的中国DTC测试市场和数据的需求,我们最好的选择是一个更高性能的基于阵列的平台。唯一的选择是Illumina的阵列解决方案,包括在全球的Infinium的筛选阵列(GSA)和iScan系统,和来自其他供应商的阵列解决方案。
在最终的评估中,我们获得了包括23andMe在内的几篇国外文献,并对配件相关问题进行了研究。我们得出的结论是,Illumina阵列解决方案非常稳定,拥有重要的全球用户基础,并提供了强大的技术支持。它能够解决由于我们快速增加的样品测试量而加剧的生产积压、质量和效率问题。基于效率、质量和服务考虑,我们选择了Illumina阵列解决方案。
问:切换到Illumina工作流后,样品处理能力增加了吗?
QZ:使用Illumina阵列解决方案,我们的样品周转时间从7个工作日减少到3个工作日。这大大提高了效率,使我们的样品处理速度从每周< 2000个样品提高到15000个样品。这是处理能力的显著提高。
问:使用帝肯液体处理解决方案自动化Illumina阵列工作流程的能力是优势吗?
QZ:自动化阵列工作流程的能力是Illumina阵列解决方案最重视的优点之一。在处理大量样品方面,自动化是未来的关键问题。
问:使用Illumina阵列解决方案实现了哪些数据质量?
GC:我们与Illumina研究,开发和生产团队合作,增加了某些标记,以创建各种习俗GSA以满足我们的需求。即使我们要求包含许多额外的定制标记,即使这些阵列的Illumina合成也是优秀的。这些自定义GSA提供良好的稳定性,相关性和高数据质量。
“使用Illumina阵列解决方案,我们的样品周转时间从七个工作日缩短到三个工作日。”
问:使用GSA进行基因检测有什么好处?
GC:WeGene是早期GSA设计讨论的一部分。自Broad Institute提出最初的设计方案以来,我们看到GSA在芯片设计理念和设计基础方面处于领先地位。
GSA用于中国和全球许多商业和科学研究组织,累积了大量数据。这种数据累积的规模和速度将继续增加可预见的未来。这为Wegene提供了具有显着优势,因为我们创建数据库,提供与未来的全球研究数据兼容的数据。在我们的消费者和科学研究中使用基于GSA的芯片使Wegene能够实现更好的结果,并增加了识别种族特异性的疾病和健康相关标记的机会。
由Illumina的阵列溶液产生的高品质的数据也提供价值给客户。其他的Infinium个人基因组的产品,比如一些23andMe公司DTC测试中,均获得监管部门的批准在美国States.Results我们从与GSA的Infinium和iScan系统进行个人基因组测试将支持我们自己的努力获得监管批准获得中国等地区。Illumina的阵列解决方案为我们的客户提供值得信赖的可靠DTC基因测试。
问:您是否开始使用Illumina Asian Semencing阵列(ASA)?
GC:我们还没有开始使用ASA。我们将与Illumina合作,为中国少数民族定制ASA芯片,支持未来WeGene基因检测产品的开发。
问:Illumina Arraylab咨询服务在建立新的实验室工作流程方面提供了哪些好处?
QZ:Illumina ArrayLab咨询团队在规划和设计大规模生产实验室操作方面拥有丰富经验。他们帮助我们建立设施设计,并确定高效工作流程所需的系统数量。从消耗品的角度来看,我们与他们合作创建了一个生产阵列装运计划,以支持我们不断增加的样本量。ArrayLab团队还帮助我们确定人员配备和外部资源预测,以及可扩展、高性能实验室所需的自动化和过程控制要求。团队的经验和指导使我们能够避免在整个建设和开发过程中可能遇到的潜在问题,如果我们自己协调一切的话。ArrayLab咨询服务团队使我们能够以一种更快速、更高效的方式在成熟、成熟的模型上开始运行我们的实验室。
问:你们用什么软件管道进行数据分析?
QZ:Illumina协助我们设计了一个高吞吐量分析软件管道。我们优化了Illumina提供的标准数据分析管道,为我们的大型基因组学数据厂提供。需要大量的计算节点以有效地处理我们产生的数据。我们还开发了几个云组件,以便能够对数据进行分析和解释。
“ArrayLab咨询服务团队使我们能够以更快、更有效的方式,在一个成熟的、建立的模型上开始运行我们的实验室。”
问:您是否正在评估NGS,以开发基因检测,以扩大您的DTC产品供应?
GC:WeGene致力于为客户提供最新的基因检测技术和最佳方法。为了获得全面的个人基因组数据,我们需要对整个基因组进行排序。利用NGS,特别是全基因组测序(WGS),开发新的基因检测产品,将使我们能够为客户提供更好、更全面的个人基因组检测和分析服务。因为WGS分析的是整个基因组而不是单个基因,所以它提供了一个更深入的遗传变异评估。
我们正在使用WGS试点研究中的最新排序系统,包括Novaseq™6000系统。通过各种全球组织的学术研究团队的合作,我们正在执行数千名客户全基因组序列的数据分析和管理。
试点研究测序结果令人印象深刻。WGS提供比阵列显著的更多信息。我们为客户提供参与与他们的WGS VCF文件的研究,使他们可以提交他们进行分析,第三方数据分析公司。例如,有同时提供Y染色体的基于数据分析结果的服务。随着原始序列数据,我们还包括在确定细胞的年龄使用端粒长度的数据,以及其他相关的分析结果。
我们的试点研究中的WGS数据将用于进一步开发我们的定制个人基因组芯片,以便在亚洲人口中进行遗传测试。结合数组归纳和质量控制数据,它将使我们进一步提高我们的自定义阵列。
问:NovaSeq 6000系统在这些研究中表现如何?
GC:该NovaSeq 6000系统是世界上最重要的测序平台之一,提供了极为出色的性能,数据质量和稳定性。
问:NGS如何积极影响您的DTC业务?
GC:我们认为,随着技术的进展和排序成本降低,NG最终将成为个人基因组测试的主流技术。这就是为什么我们正在进行必要的研发,以提高我们的NGS技术能力。我们研究的NGS数据将使我们的中国民族和东亚数据库开发有益,提高基于GSA的发行,并作为下一代Wegene个人基因组测试服务的基础。我们将继续与各种研究部门的科学家进行深入的研究,以利用NGS全基因组测序数据的益处。
“我们相信,随着技术的进步和测序成本的降低,NGS最终将成为个人基因组检测的主流检测技术。”
问:NGS数据如何有利于数据库的进一步开发?
GC:我们的WeGene中国民族和东亚基因组数据库开发的目标是推动基因测试技术的应用和研究,造福于个人消费者以及全球研究组织。NGS技术有助于测试整个基因组,为我们提供详细的遗传信息,如结构变异、拷贝数变异和罕见突变的存在。这些数据对于研究癌症、孤独症和罕见疾病的学术研究人员来说非常有价值。
我们相信,如果我们将NGS技术全面、大规模地应用于个人基因组产品中,就可以将这些学术领域的研究成果迅速惠及个人消费者。个人消费者的数据将反过来刺激基因组数据库的研究。
问:Wegene在扩大其DTC业务方面的下一步是什么?
QZ:我们希望迅速扩大用户基础。根据我们的预测,我们预计2019年用户将达到100万,五年内用户将超过2000万。我们将继续在中国、东亚和全球推广和教育潜在客户WeGene服务。我们将继续寻求研究伙伴关系,以提高我们的消费者基因检测服务以及华人和东亚基因组数据库的价值和效用。
问:Illumina产品,系统和服务如何支持这些目标?
QZ:Illumina的产品、系统和服务将有助于降低成本,提高测试效率,实现更高的生产效率,通过智能自动化系统扩大我们的生产和分析服务。