WGCNA解析の続きです。前回は、モジュールを作りその後着目するモジュールの選定まで実施しました。
今回は前回の結果から着目するモジュール Module 3について深堀りしていきたいと思います。
GSVA scoreとの関係
まずは、GSVA(Gene Set Variation Analysis)スコアを算出しました。
GSVAは遺伝子発現の結果から、モジュール(もしくは遺伝子の集まり)の活性値をscoreとして算出してくれます。
その結果が以下の図になります。モジュール活性度(GSVA score)をサンプル間で比較してみました。

Module 3 (ME3と表示)ではEPO3ならびにEPO4でGSVAの上昇、Post7での減少が顕著に見られますね。
エンリッチメント解析
次に、Module 3の生物学的解釈を行うためエンリッチメント解析を実施しました。
エンリッチメント解析についての説明は省きますが、今回はGO (Biological Process)、KEGG、Reactomeで実施しました。
Gene Ontology | Biological Process


KEGG

Reactome

Module 3は免疫系のシグナルに強く関与していそうですね。
着目モジュールの中の重要遺伝子の選定
kME
各遺伝子とモジュール固有の「代表的な発現パターン(ME)」との相関係数
遺伝子固有の値になり、その絶対値が大きいほどそのモジュールにおける寄与が大きい
kWithin
kWithinはトポロジーベースの中心性の指標みたいなものです。
こちらも遺伝子固有の値となり、その値が大きいほど多くの遺伝子と相関していてネットワーク上接続しているということです。
Gene Significance (GS)
Gene Significance (GS)は単純にその遺伝子発現と処置やフェノタイプとの相関です。
遺伝子優先順位決め
kMEとkWithinおよびGSを算出したら、その後の遺伝子の優先順位を決めていきます。
kMEだけを使っても良いですし、kWithinだけを使っても良し、kMEとkWithin両方を使っても良いです。
どうやって決めるかはその解析で何を優先したいかという解析者の考えによります。
今回はkMEをメインにしつつ、kWithinやGSの要素も入れていきたいと思いますので、今回は以下の計算を行います。
score = 0.5 x kME(percent_rank) + 0.3 x kWithin(percent_rank) + 0.2 x GS(percent_rank)
その結果、Module 3の中心的な遺伝子でかつEPO4と強い相関のある遺伝子一覧が取得できました。

上位Top10を出しましたが、あとはこれらの遺伝子について深堀りしていく(例えばWet研究を実施する等)するとより良い研究になるでしょう。
これらの遺伝子を含んだネットワーク図を作成するのも良いかもしれません。
ひとまず、今回はこれでWGCNA解析を終わりたいと思います。




コメント