研究の進捗状況
「大量で多元的なデータの情報・統計手法を適用したゲノム機能と遺伝的ネットワーク抽出」
マウスの複雑形質(生体内構造、骨格形態、行動パターンなど)の表現型を数値データ化して評価する統計解析手法の開発し、この手法を用いて実験交配集団等を対象としたデータ収集を実施した。
3-1: 3D画像による体脂肪計測法の定量化とデータマイニング
融合研究プロジェクト研究第I期の成果である生体イメージングからの正確な表現型測定の手法を改善し、遺伝解析(QTL解析)に繋げることを目指している。
マウスの全身CT画像から自動的に内臓および皮下脂肪を認識し、画素数から重量を測定する自動体脂肪計測アルゴリズムにより算出したデータと、同一個体の解剖による臓器重量データとを比較した。X 線CT による脂肪組織量と解剖による脂肪組織重量には高い相関関係が認められ、週齢と性別による傾向もみられた。
画像の生成などデータ収集は数時間程度で完了でき、十分な速度を実現できた。今後、多様な遺伝的背景を持つ個体群を対象とし、表現型に関連する遺伝子座の探索を行う。
3-2:次世代シーケンサによる対立遺伝子発現バイアスの遺伝的制御機構の解明
本研究は両親由来の対立遺伝子による遺伝子発現量の差異を制御する機構を解析することを目的としている。
マウスのC57BL/6J(B6)系統とMSM系統には膨大なcSNP(26,000のnon-synonymous塩基置換を含む)がある。この両系統を交配して得たF1を対象に次世代シーケンサによるRNA-Seq法を用いることで、哺乳類で初めて、ゲノム上の全遺伝子の発現量の差異(アリルバイアス、極端な場合にはゲノムインプリンティング現象)のプロファイリングが可能となる。B6♂×MSM♀の産仔87匹、MSM♂×B6♀の産仔46匹から、試料採取して発現情報を得るとともに、解剖を行い臓器重量、血中パラメータなどのデータ収集を行った。
他にJF1系統についても資料とデータの収集を開始しており、今後、各系統の広範な遺伝子発現制御の解析が行えるものと考える。
3-3: 隠れマルコフによるマウスの社会行動状態の自動抽出と、マルコフ空間による系統比較
社会行動の解析は従来、人による観察が中心であったが、コンピュータ学習により社会行動の自動推定(分類)を可能にし、大量の画像から、有用な行動データを自動抽出することを目的とする。2個体のマウスのフィールド内での社会的な相互作用(追随行動、攻撃など)を観察するソーシャルインタラクションテストを用い、マウスの位置データから4つの指標(2個体間の距離、相対速度、相対角度、平均速度)を算出し、観察から得られる結果を隠れマルコフモデル(HMM)によって学習させた。その結果、自動解析により幾つかの行動については非常に信頼性のある推測が可能となった。
MSM系統のマウスは非常に社会行動が盛んで、逆にB6系統は少ない事が知られている。この2つの系統について染色体を1本ずつ置換したコンソミックマウスを用いて社会行動の自動抽出を行ったところ、特徴的な行動を示す系統や、性差のある系統などが見られた。これらのカイセキヨウノソフトウェアは論文発表後、ホームページから公開する予定である。
3-4: マウスの超音波発声データの解析
音声データは時間、周波数と振幅の3次元で観測され、複雑な情報を含む。またノイズも含まれやすく抽出、解析は困難である。マウスの超音波発声を解析する手法の開発を目指し、予備実験を行っている。、あじ。一定の振幅(声の大きさ)以上の音波変化パターンを時間と周波数の2次元に縮約し、ノイズを除去(平滑化)、得られた2次元曲線の関数化、クラスター分析を行うことで、音声データの解析が可能となると考えている。
3-5:eQTL解析による表現形質と遺伝子発現のネットワークの解明
栽培イネO. sativa祖先種である野生イネO. rufipogonは、分類学上の亜種は定義されていないが、多様な形質を示し、数種類のグループに分けられることが示唆されている。融合研究プロジェクト第I期では、O. rufipogonについて多様な量的形質データを収集し、その多くが一年生系統と多年生系統の2グループに分類された。
そこで、表現型の離れた代表的な2品種(一年生W0106と多年生W1921)を交雑した、組換固定化集団による遺伝解析を行う事とした。2品種を交雑したF1から、自植、多植、葯培養などの手法を組み合わせ、幾つかの組換固定化集団を育成することとした。
並行して、W0106とW1921のゲノムを次世代シーケンサで解読し、栽培種O. sativa japonica Nipponbareのゲノム配列を参考にドラフト配列情報を得た。今後、このドラフト配列をもとに発現解析および配列変異解析を行う予定である。
3-6:構造多型を考慮した発現解析手法を用いた遺伝子発現量差の解析
融合研究プロジェクト第I期により開発した手法をもとに、ゲノム配列が既知のイネ2品種(japonica Nipponbareとindica 93-11)の苗条、幼穂について、マイクロアレイによる遺伝子発現量比較を行った。
いずれも対象遺伝子の30%程度が高発現しており、品種間で発現量に差が見られたものは約7%であった。このうちの約半数の487個は苗条、幼穂ともに発現量の差が見られ、データベースをもとに解析を進めると、このうち353遺伝子は組織を問わずNipponbare で高発現、93-11ではほとんど発現せず、71遺伝子は93-11で高発現、Nipponbareでほぼ発現せずで、片方では遺伝子そのものが無いか、恒常的な発現抑制を受けていると推定された。現在この内容を論文に作成している。
3-7:ゼブラフィッシュの多様な表現型の抽出とその表出法の確立
モデル脊椎動物ゼブラフィッシュにおいて、トランスポゾンを用いて、Gal4を細胞・組織・器官特異的に発現するトランスジェニックゼブラフィッシュを新たに100系統、合計800系統作製し、供与できる環境を整えた。国内外の器官形成研究者と融合研究を進めている。
新しい表現型抽出法としてゼブラフィッシュの神経活動を、カルシウムインディケーターGCaMPを用いてイメージングするシステムの開発に成功した。脊椎の運動神経、脳内の神経活動の時空間パターンデータ、また、脊椎の運動神経の発火パターンデータを収集するプログラムの開発を進めている。またこれらの時空間パターンの数理的な解析手法の研究を開始した。
3-8:ショウジョウバエ翅形態異常のゲノム相関解析
ショウジョウバエのゲノムにコードされる15,000個の遺伝子のうち約7割は、主要な遺伝子の補佐的・調節的役割を担うと考えられている。
ハエの翅は複数のシグナル伝達系が協調して作られ、関連遺伝子の変異体では特徴的な形態異常が観察されるが、よりかすかな形態異常を検出できれば、補佐的な遺伝子の働きを明らかにできるかもしれない。そこで、遺伝研に維持されている7,000遺伝子のRNAi変異体の翅を詳細に解析することとした。
H22年度は各系統の翅の画像収集を継続し、これまでに12000のRNAi系統から9000系統の翅を2次元画像として撮影した。今年度は、翅の外縁を認識し、全体の面積を計算するプログラムを開発し、現在検証中であるが、視覚で判別しにくい僅かな違いを検出できると期待している。翅形態の異常は、シグナル伝達系ごとに特徴が異なり、これらをどのように取得していくかが今後の課題である。また、膨大な画像データを処理する新たなプログラムの開発も進めていきたい。