Research

生命情報科学

生命情報科学とは,計算機科学の手法を駆使して遺伝情報を担うゲノムや生体内で働くタンパク質などに由来する情報を解析し,生命のしくみを明らかにすることを目指す研究分野です.生命の研究というと,巨大な装置や試験管が並んだ実験室を思い浮かべる方が多いのではないでしょうか.しかし,現在では様々な実験装置から得られる大量のデータを人工知能技術などによって解析し,医学や生物学に重要な知見を発見する研究が非常に重要視されています.

生命科学とビッグデータ

近年,生命情報を観測する装置の性能が著しく上昇しています.例えば,DNAの塩基配列を解読する装置(シークエンサー)の性能はここ10年ほどの間に10000倍も向上しました1.最新のシークエンサーはたった一度の実験で数千億塩基対もの情報を読みだします.このように大量の生命情報が取得できるようになった今,生命科学の方法論は大きく変わろうとしています.限られた量のデータしか得ることができなかった従来の研究では,研究者の経験にもとづき観測する対象を絞り込んでいましたが,現在では網羅的にデータを取得してから重要な情報を洗い出すのが主流になりつつあります.例えば,ガン細胞で発現している遺伝子のゲノム配列を全て読み出し,正常な細胞で発現している遺伝子のゲノム配列と比較をして数万種類の遺伝子からガンの原因遺伝子を探し出すといった解析が可能になったのです.膨大なデータを扱うには高度な情報科学の技術が必要不可欠です.私たちの研究室では,爆発的に増大する生命データを活用するための新技術の開発に挑戦します

About

研究トピック

ゲノム配列解析技術の高度化

ゲノムは4種類の文字からなる文字列(配列)として表現することができるため,配列の比較解析によって様々な知見を得ることができます.配列の整列(アラインメント),クラスタリング,参照ゲノムグラフの構築などを効率化するアルゴリズムの研究を推進します.
キーワード: Suffix Array, 複合ソート法,HMM, De Bruijin Graph,次世代シークエンサー など
関連する成果(抜粋): WSHA2014, ST2011

生命情報のプライバシ保護データマイニング

生命情報科学ではプライバシにかかわる様々な情報を扱います.例えば,ヒトゲノムは個人の性質をあらわす情報と個人の特定につながる情報を含むため取り扱いには配慮が必要です.このようなデータを安全に解析するためのプライバシ保護技術の研究を推進します.
キーワード: プライバシ保護データマイニング,準同型暗号,差分プライバシ,秘密分散,SGX など
関連する成果(抜粋): SJNS2018, SNR2016, S+2015

その他 (抜粋)

天然変性領域の予測タンパク質の基質結合部位の予測, タンパク質間相互作用ネットワーク解析


© The Computational Biology Research Laboratory at Waseda University 2018. All rights reserved.

Powered by Hydejack v8.1.1