「遺伝機能システム学」の基盤構築
大量ゲノム配列情報や遺伝子発現情報のデータ解析手法と多元的な生物表現型多様性の統計モデリング手法を開発します。両者を統合することにより複雑な遺伝的相関構造を描出するための方法を構築し、モデル生物に適用してゲノム機能と遺伝的ネットワークの抽出を行います。これにより、多数の遺伝因子の高次連関から形成される生物多様性を、システムとして理解することを目指します。
ヒトゲノム解読計画以来、生命科学の研究スタイルは、大量のゲノム情報を基盤とするデータ駆動型へとパラダイムシフトしつつあります。近年の超並列大規模シーケンサの登場は世界的にもその勢いを加速させていますが、我が国の大学研究機関の対応は大きく後れています。今後の情報ゲノム科学の発展に不可欠な研究コミュニティの形成や、社会にこれらの超大量データを用いた科学知の必要性を認知してもらうためには、早急の基盤形成が必須です。
そのために、本プロジェクトでは、最新のゲノムテクノロジーを駆使し、系統的にゲノム・遺伝子関連情報の大規模生産を行う一方、多元的な表現型データを系統的に収集し、それぞれの情報を統計学的に解析する手法の開発を目指します。さらに、これらのデータを統合し、遺伝的相関構造の描出を行うための統計学的手法を開発し、モデル生物の大量のゲノム情報と表現型データに適用してブラッシュアップし、汎用的にゲノム機能と遺伝的ネットワークの抽出を行える、「遺伝機能システム学」の基盤を構築します。
サブテーマ1、2、3が相互にその情報を交換しながら、データセントリックの原理に従って生命現象の新たな方法論を見つけ、新規な原理と解釈を提案することを目標として推進します。
次世代シーケンサを中心とする最新のゲノムテクノロジーを駆使し、系統的にゲノム・遺伝子関連情報の大規模生産を行い、また、それらの情報を解析する統計学的な手法の開発を目指します。
大量のゲノム関連データと多元的な生物表現型多様性データを統合することで、遺伝的相関構造の描出を目指します。そのための統計学的手法の開発と最適化を行っています。
多元的な表現型データを収集し、サブテーマ1、2で確立した情報学的・統計学的手法を、モデル生物の大量のゲノム情報と表現型データに適用して、手法の評価、さらなる改善を行い、汎用的にゲノム機能と遺伝的ネットワークの抽出を行える、「遺伝機能システム学」の基盤を構築します。