WGCNA解析 part 2

WGCNA解析の続きです。前回は、モジュールを作りその後着目するモジュールの選定まで実施しました。

今回は前回の結果から着目するモジュール Module 3について深堀りしていきたいと思います。

GSVA scoreとの関係

まずは、GSVA（Gene Set Variation Analysis）スコアを算出しました。

GSVAは遺伝子発現の結果から、モジュール（もしくは遺伝子の集まり）の活性値をscoreとして算出してくれます。

その結果が以下の図になります。モジュール活性度（GSVA score）をサンプル間で比較してみました。

Module 3 (ME3と表示)ではEPO3ならびにEPO4でGSVAの上昇、Post7での減少が顕著に見られますね。

次に、Module 3の生物学的解釈を行うためエンリッチメント解析を実施しました。

エンリッチメント解析についての説明は省きますが、今回はGO (Biological Process)、KEGG、Reactomeで実施しました。

Module 3は免疫系のシグナルに強く関与していそうですね。

各遺伝子とモジュール固有の「代表的な発現パターン（ME）」との相関係数

遺伝子固有の値になり、その絶対値が大きいほどそのモジュールにおける寄与が大きい

kWithinはトポロジーベースの中心性の指標みたいなものです。

こちらも遺伝子固有の値となり、その値が大きいほど多くの遺伝子と相関していてネットワーク上接続しているということです。

Gene Significance (GS)は単純にその遺伝子発現と処置やフェノタイプとの相関です。

kMEとkWithinおよびGSを算出したら、その後の遺伝子の優先順位を決めていきます。

kMEだけを使っても良いですし、kWithinだけを使っても良し、kMEとkWithin両方を使っても良いです。
どうやって決めるかはその解析で何を優先したいかという解析者の考えによります。

今回はkMEをメインにしつつ、kWithinやGSの要素も入れていきたいと思いますので、今回は以下の計算を行います。

score = 0.5 x kME(percent_rank) + 0.3 x kWithin(percent_rank) + 0.2 x GS(percent_rank)

その結果、Module 3の中心的な遺伝子でかつEPO4と強い相関のある遺伝子一覧が取得できました。

上位Top10を出しましたが、あとはこれらの遺伝子について深堀りしていく（例えばWet研究を実施する等）するとより良い研究になるでしょう。

これらの遺伝子を含んだネットワーク図を作成するのも良いかもしれません。

ひとまず、今回はこれでWGCNA解析を終わりたいと思います。