一旦一种基因变异与一种特定的复杂疾病相关,就必须确认其参与和生物学效应。已鉴定的变体可能对蛋白质结构、基因表达和调节产生各种影响,也可能根本没有影响。利用基因组学、转录组学和表观基因组学方法进行数量性状基因座(QTL)分析,可以对与疾病相关的变异进行注释,并对与疾病差异表达的基因进行功能性影响,以阐明疾病机制,并为进一步研究确定基因和途径的优先顺序。
差异表达分析用于不同条件下或响应于确定的刺激以识别和测量基因表达的改变。理解哪些基因过 - 或欠与疾病影响的表型表达的是其中的基因和途径受到影响或可能与疾病有关的判定的一个重要步骤。虽然阵列是第一技术应用于大规模的表达研究,他们已被替换,在很大程度上,通过RNA测序(RNA-SEQ)作为一个新兴的最佳实践。RNA测序提供关于除了转录同种型,基因融合体,剪接变体,以及其它特征,而不先验知识的限制基因表达信息。
用于差异基因表达分析的RNA测序工作流程开始于RNA提取,库准备,和测序。数据分析包括读取的后处理运行,个体的基因表达水平,归一化和差异表达的基因的识别)的估计。下面的方法可用来洞察转录和其潜在的作用在复杂的疾病:
表观遗传学是生物学机制的研究,在不改变DNA序列通过监管机制,改变基因的活性。识别基因调控机制,如开放的染色质,甲基化,或启动子和转录因子结合的状态,提供了深入了解为什么基因可以在给定的级别表示。除了重要的功能在正常的生物过程,后生过程建立了链接到各种复杂的疾病,包括癌症,自身免疫疾病,神经疾病,障碍和精神障碍。下面的方法可用来洞察表观基因组和其潜在的作用在复杂的疾病。
全基因组测序是用于识别与复杂疾病关联的罕见变异的常用方法。它是一个可以通话双方共同和整个基因组罕见的变异,包括可能有助于疾病结构变异的唯一方法。
CNVs是一种基因组改变,通常由结构重排引起,导致一个或多个基因拷贝数量异常。像SNPs一样,某些拷贝数变异与疾病易感性有关。基于数组的方法检测新生cnv(不存在于任何亲本或通过任何亲本传播)提供了有效和可靠的大规模分析。阵列可以用来描绘基因组变异,如扩增、缺失、重排和杂合性复制中性缺失。然而,普通CNV的作用(结果)目前还不清楚。
虽然基因分型阵列对大拷贝数病毒检测有效,但对小拷贝数病毒(< 50千碱基)的检测灵敏度较低。NGS提供了碱基对分辨率,可以检测到被数组遗漏的小型cnv。这对复杂疾病中缺失遗传性的研究是有用的。高分辨率测序和高通量阵列为实现研究目标提供了有效的全基因组询问选项。
数量性状位点(QTL)是与特定表型或性状相关的DNA区域,在种群中会发生变化。通常,qtl与具有连续变异的性状(如身高或肤色)相关,而与具有离散变异的性状(如头发或眼睛颜色)无关。QTL定位是一种统计分析,以确定哪些分子标记导致特定性状的数量变化。由于单个位点可能包含多个变异,因此,定量分析或全基因组测序是QTL定位的关键先决条件,以便精确鉴定贡献的分子标记。qtl已经扩展到包括在基因型到表型连续体的不同水平上起作用的变异。
QTL分析是标注与疾病相关变异的有效手段。通过了解变异的功能影响,它可以区分与疾病有关的变异和与疾病相关的变异。通过利用不同的QTL分析,变异的分子相互作用网络及其影响的基因开始进入人们的视野,并为哪些潜在基因和途径真正驱动疾病提供证据。这使我们能够将时间、资源和资金投资于最有可能与疾病有关的目标。
结合来自Illumina广泛的遗传分析分析的结果是一个复杂问题的强大的综合方法。Illumina提供数据分析软件,支持数据集成,如基因分型和基因表达的eQTL分析。
阅读技术报告表达数量性状位点(Expression quantitative trait loci, eQTL)是影响一个或多个基因表达的遗传变异。一个eQTL可以以顺式(局部)或反式(在一定距离上,如在不同的染色体上)作用于其基因靶。eQTL定位需要对每个样本进行基因组阵列或WGS分型和RNA-Seq基因表达分析。
甲基化数量性状位点(Methylation quantitative trait loci, meQTL)是影响DNA甲基化模式的遗传变异。meqtl可以影响整个基因组区域的甲基化。meQTL定位需要全基因组基因分型和DNA甲基化分析。
染色质可及性数量性状位点(caQTL)是影响核小体包装、定位和染色质可及性的遗传变异。caQTL定位需要通过阵列或WGS进行全基因组基因分型,并通过ATAC-Seq或Hi-C等方法进行染色质可及性分析。
结合数量性状基因座(BQCL)是影响转录因子结合的遗传变异。BQCL图谱需要通过阵列或WGS和芯片序列进行全基因组基因分型。