これはブログではない

生物学(主に理論生物学)の論文を書くために読みます

トランスクリプトームと全体的なクロマチン免疫沈降データからの転写制御の予測のための重みづけエンリッチメント法

Eiryo Kawakami;...;Hiroaki Kitano(2016.6, Nucleic Acids Res.)[Weighted enrichment method for prediction of transcription regulators from transcriptome and global chromatin immunoprecipitation data]

 

理由

実験医学数理モデル特集の第3章1. 「公共ハイスループットChIPデータを用いた遺伝子制御ネットワークの構築とその活用法」の参考文献

 

概要

トランスクリプトームデータの基盤に基づく重要な転写制御因子の予測は、細胞内過程と特性を理解するために、多くの予測する計算機的方法の一つである。ここでは、この問題を解決するために、大量のクロマチン免疫沈降(ChIP)実験データを用いる新しい方法を示す。公共ハイスループットChIPデータは、包括的なデータベースを構築するために集められ、454転写制御因子の8578738の結合相互作用を含む。転写因子(TF)結合イベントの異種頻度の情報を組み込むために、重みづけt検定過程、すなわち重みづけパラメーター遺伝子セット解析(wPGSA)を用いる遺伝子セット解析の柔軟な枠組みを開発した。入力としてトランスクリプトームデータを用いて、wPGSAによって観察された遺伝子発現の原因となる転写制御因子の活性が予測される。過剰発現TFsを含む既出のトランスクリプトームデータを用いてwPGSAの実証を行うことで、この方法が細胞種や条件に関わらず、多様なTFsの活性を予測でき、生物学的観察と合致することが分かった。さらに、wPGSAを他の論文トランスクリプトームデータに応用して、細胞再プログラミングとインフルエンザウイルスの病理に潜在的に重要な制御因子を同定し、制御メカニズムの根底にある説得力のある仮説を作成した。この柔軟な枠組みによって、重みづけにおけるハイスループット実験データを組み込むことで生物学的制御の動的かつ頑健な構造を解明できるだろう。

 

雑記

大規模データ解析って、どうしてこうも心が動かないんだろう