2013 年 2013 巻 SWO-029 号 p. 10-
創薬やバイオレメディエーション(微生物や植物を用いた土壌・水質汚染の浄化)などの研究分野では,タンパク質の構造と機能を知ることは重要なテーマである.研究対象の系(物質の選択と実験方法の組合せ)をデータベースからオントロジーでしぼり込み,機械学習やシミュレーションを実行することで,生物実験のコスト軽減が期待できる.本研究では農学生命科学および創薬分野におけるプロテオミクスで,タンパク質-リガンド結合部位ペアのデータベースの構築手法としてLODを活用していることを示した.原子間距離のデータをタンパク質立体構造および低分子化合物データベースのRDFでアノテーションすることができた.また,タンパク質配列データベースをLODに加えるために,クラウド環境でのトリプルストアのパフォーマンス計測により大規模なRDFを運用するための指標を得ることができた.これは生命科学のアプリケーションを開発していく上で役に立つだろう.