一旦一种基因变异与一种特定的复杂疾病相关,就必须确认其参与和生物学效应。已鉴定的变体可能对蛋白质结构、基因表达和调节产生各种影响,也可能根本没有影响。利用基因组学、转录组学和表观基因组学方法进行数量性状基因座(QTL)分析,可以对与疾病相关的变异进行注释,并对与疾病差异表达的基因进行功能性影响,以阐明疾病机制,并为进一步研究确定基因和途径的优先顺序。
差异表达分析用于识别和测量不同条件下或特定刺激下基因表达的变化。了解哪些基因在疾病表型中过度表达或表达不足是确定哪些基因和途径受到影响或可能与疾病有关的一个重要步骤。尽管阵列是第一种应用于大规模表达研究的技术,但它们在很大程度上已被RNA测序(RNA Seq)所取代,成为一种新兴的最佳实践。RNA Seq除了提供转录亚型、基因融合、剪接变异体和其他特征外,还提供有关基因表达的信息,而不受先验知识的限制。
差异基因表达分析的RNA-Seq工作流程从RNA提取、文库准备和测序开始。数据分析包括读取的运行后处理、单个基因表达水平的估计、差异表达基因的标准化和识别)。以下方法可用于深入了解转录组及其在复杂疾病中的潜在作用:
表观遗传学是在不改变DNA序列的情况下,通过调节机制改变基因活性的生物学机制的研究。识别基因调控机制的状态,如开放染色质、甲基化或启动子和转录因子的结合,可以深入了解基因为何在给定水平上表达。除了正常生物过程中的重要功能外,表观遗传过程还与各种复杂疾病建立了联系,包括癌症、自身免疫性疾病、神经系统疾病和精神疾病。以下方法可用于深入了解表观基因组及其在复杂疾病中的潜在作用。
全基因组测序是鉴定与复杂疾病相关的罕见变异的常用方法。这是唯一可以调用基因组中常见和罕见变异的方法,包括可能导致疾病的结构变异。
CNVs是一种基因组改变,通常由结构重排引起,导致一个或多个基因拷贝数量异常。像SNPs一样,某些拷贝数变异与疾病易感性有关。基于数组的方法检测新生cnv(不存在于任何亲本或通过任何亲本传播)提供了有效和可靠的大规模分析。阵列可以用来描绘基因组变异,如扩增、缺失、重排和杂合性复制中性缺失。然而,普通CNV的作用(结果)目前还不清楚。
虽然基因分型阵列对大拷贝数病毒检测有效,但对小拷贝数病毒(< 50千碱基)的检测灵敏度较低。NGS提供了碱基对分辨率,可以检测到被数组遗漏的小型cnv。这对复杂疾病中缺失遗传性的研究是有用的。高分辨率测序和高通量阵列为实现研究目标提供了有效的全基因组询问选项。
数量性状位点(QTL)是与特定表型或性状相关的DNA区域,在种群中会发生变化。通常,qtl与具有连续变异的性状(如身高或肤色)相关,而与具有离散变异的性状(如头发或眼睛颜色)无关。QTL定位是一种统计分析,以确定哪些分子标记导致特定性状的数量变化。由于单个位点可能包含多个变异,因此,定量分析或全基因组测序是QTL定位的关键先决条件,以便精确鉴定贡献的分子标记。qtl已经扩展到包括在基因型到表型连续体的不同水平上起作用的变异。
QTL分析是注释与疾病相关的变异的有效手段。通过了解变异的功能效应,可以区分与疾病相关的变异和与疾病相关的变异。通过利用不同的QTL分析,变异及其影响的基因的分子相互作用网络开始显现出来,并为哪些潜在基因和途径真正驱动疾病提供证据。这使得我们能够将时间、资源和资金投入到最有可能与疾病有关的目标上。
结合广泛的Illumina基因分析分析结果是解决复杂问题的一种强大的综合方法。Illumina提供数据分析软件,支持数据集成,例如eQTL分析的基因表达基因分型。
阅读技术说明表达数量性状位点(Expression quantitative trait loci, eQTL)是影响一个或多个基因表达的遗传变异。一个eQTL可以以顺式(局部)或反式(在一定距离上,如在不同的染色体上)作用于其基因靶。eQTL定位需要对每个样本进行基因组阵列或WGS分型和RNA-Seq基因表达分析。
甲基化数量性状位点(Methylation quantitative trait loci, meQTL)是影响DNA甲基化模式的遗传变异。meqtl可以影响整个基因组区域的甲基化。meQTL定位需要全基因组基因分型和DNA甲基化分析。
染色质可及性数量性状位点(caQTL)是影响核小体排列、定位和染色质可及性的遗传变异。caQTL定位需要通过阵列或WGS进行全基因组基因分型,并通过ATAC-Seq或Hi-C等方法进行染色质可及性分析。
结合数量性状位点(bQTL)是影响转录因子结合的遗传变异。bQTL定位需要通过阵列或WGS和ChIP-Seq进行全基因组基因分型。