遺伝子バリアントと特定の複雑な疾患との関連が明らかになったら、その関与と生物学的な影響を確認する必要があります。同定されたバリアントは、タンパク質の構造、遺伝子の発現、遺伝子の制御に対してさまざまな影響を与えている可能性がある一方で、一切の影響も与えていない可能性もあります。ゲノム解析、トランスクリプトーム解析、エピゲノム解析による量的形質遺伝子座(QTL)解析では、疾患と関連づけられたバリアントについて、疾患で特異的に発現する遺伝子に対する機能的な影響のアノテーションを付与し、疾患機序の解明とその後の研究における遺伝子やパスウェイの優先順位を決めることができます。
発現差解析は、さまざまな条件下や一定の刺激に対する応答における遺伝子発現の変化を同定および測定するために使用されます。疾患の表現型とともに過剰発現または過小発現している遺伝子を把握することは、疾患で影響を受けている、または疾患に関与しているであろう遺伝子やパスウェイを判定するうえで重要なステップです。アレイは大規模な発現解析に用いられた最初のテクノロジーですが、大部分は、新たなベストプラクティスであるRNAシーケンス(RNA-Seq)に置き換わっています。RNA-Seqでは、遺伝子発現に加えて、転写産物アイソフォーム、遺伝子融合、スプライスバリアントなどの特徴に関する情報を、予備知識の制限なく得られます。
遺伝子発現差解析のRNA-Seqワークフローの最初のステップは、RNAの抽出、ライブラリー調製、シーケンスです。データ解析では、リードのポストラン処理、個々の遺伝子発現レベルの評価、発現差のある遺伝子のノーマライゼーションおよび同定が実行されます。複雑な疾患のトランスクリプトームと、想定されるその役割に関する情報を得る手法としては、以下のものがあります。
エピジェネティクスは、DNA配列を変化させず、制御メカニズムによって遺伝子活性を変化させる生物学的メカニズムの研究です。オープンクロマチン、メチル化、プロモーターおよび転写制御因子の結合などの遺伝子制御メカニズムの状態を同定することで、一定のレベルで遺伝子が発現している理由に関する情報が得られます。通常の生物学的プロセスにおける重要な機能に加えて、エピジェネティックなプロセスが、がん、自己免疫障害、神経障害、精神疾患などのさまざまな複雑な疾患に関連していることが確認されています。エピゲノムと、複雑な疾患におけるその潜在的な役割に関する情報を得る手法としては、以下のものがあります。
全ゲノムシーケンスは、複雑な疾患に関連するレアバリアントを同定する一般的なアプローチです。疾患の要因となっている可能性のある構造多型を含め、全ゲノムのコモンバリアントとレアバリアントの両方をコールできる唯一の手法です。
CNVは、1つ以上の遺伝子の異常なコピー数をもたらすゲノム変異で、一般的に構造再編成によって引き起こされます。SNPと同様に、疾患感受性との関連が指摘されているCNVもあります。de novo CNV(両親のどちらにも存在しない、またはどちらからも伝達されなかったCNV)を検出するアレイベースのアプローチでは、効率的で信頼性の高い大規模解析が可能です。アレイを使用して、増幅、欠失、再編成、コピー数中立的なヘテロ接合性欠失などのゲノム変異をプロファイリングすることができます。ただし、コモンCNVの役割(アウトカム)については、現時点でほとんど解明されていません。
ジェノタイピングアレイは大規模なCNV検出には効率的ですが、小さなCNV(50キロベース未満)には感度が高くありません。NGSにはアレイで見過ごされる小さなCNVを検出できる塩基対解像度があります。この利点は、複雑な疾患の見失われた遺伝性の研究に役立てることができます。シーケンスの高解像度とアレイのハイスループットのおかげで、ゲノムワイドに調べる効果的な手法がもたらされ、研究目標を実現することができます。
量的形質遺伝子座(QTL)は、ある集団内で差異の見られる特定の表現型または形質と関連づけられるDNAの領域です。QTLは一般的に、髪や目の色などの不連続な相違のある形質ではなく、身長や肌の色などの連続的な相違のある形質に関連しています。QTLマッピングは、特定の形質の量的変化をもたらす分子マーカーを同定する統計解析手法です。単一の遺伝子座に多くのバリアントが存在する可能性があるため、インピュテーションや全ゲノムシーケンスは、要因となる分子マーカーをQTLマッピングで精密に同定するうえで重要な必要条件です。QTLは、遺伝型から表現型までのさまざまなレベルで作用するバリアントを含むよう拡張されています。
QTL解析は疾患に関連するバリアントにアノテーションを付加する効果的な手法です。バリアントの機能的な影響を解明することにより、疾患と関連するバリアントの中で、疾患に関与するバリアントを識別することができます。さまざまなQTL解析の利用で、影響を与えるバリアントと遺伝子の分子相互作用のネットワークが明らかになり始め、実際に疾患を亢進させている、根底に存在する遺伝子やパスウェイに関する証拠がもたらされています。これにより、疾患に関与している可能性がきわめて高いターゲットへの時間、リソース、資金の投入が実現します。
イルミナの幅広い遺伝子解析アッセイの結果を組み合わせることで、複雑な問題に対する強力な統合的アプローチを形成できます。イルミナが提供するデータ解析ソフトウェアは、eQTL解析用の遺伝子発現とジェノタイピングなどのデータ統合に対応しています。
テクニカルノートを読む発現量的形質遺伝子座(eQTL)は、1つ以上の遺伝子の発現に影響を与える遺伝子バリアントです。eQTLは、in cis(局所的)またはin trans(たとえば別の染色体などの少し離れた位置)で遺伝子ターゲットに作用します。eQTLマッピングには、各サンプルについてのアレイまたはWGSによるゲノムワイドジェノタイピングとRNA-Seqによる遺伝子発現解析が必要です。
メチル化量的形質遺伝子座(meQTL)は、DNAのメチル化パターンに影響を与える遺伝子バリアントです。meQTLsは、広範囲にわたるゲノム領域のメチル化に影響を与える可能性があります。meQTLマッピングには、アレイまたはシーケンスによるゲノムワイドジェノタイピングとDNAメチル化解析が必要です。
クロマチンアクセシビリティ量的形質遺伝子座(caQTL)は、ヌクレオソームパッキングと配置、クロマチンアクセシビリティに影響を与える遺伝子バリアントです。caQTLマッピングには、アレイまたはWGSによるゲノムワイドジェノタイピングとATAC-SeqやHi-Cなどの手法によるクロマチンアクセシビリティ解析が必要です。
結合量的形質遺伝子座(bQTL)は、転写因子結合に影響を与える遺伝子バリアントです。bQTLマッピングには、アレイまたはWGSによるゲノムワイドジェノタイピングとChIP-Seqが必要です。