情報管理
Online ISSN : 1347-1597
Print ISSN : 0021-7298
集会報告
集会報告 トーゴーの日シンポジウム2017 バイオデータベース:「作る」から「使う」へ
森 亮樹
著者情報
ジャーナル フリー HTML

2018 年 60 巻 11 号 p. 828-831

詳細

開催情報

  • 日程   2017年10月4日(水)~5日(木)
  • 場所   東京大学農学部弥生講堂一条ホール,アネックス(東京都文京区)
  • 主催   科学技術振興機構 バイオサイエンスデータベースセンター
  • 後援   内閣府,文部科学省

1. はじめに

インドの図書館学者ランガナタンは「図書館学の五法則」を発表するに当たり,その第1項に「Books are for use(図書は利用されるためのものである)」を掲げた1)。図書に限らず,情報資源は利用されて初めて価値をもつのであり,研究データももちろん「利用されるためのもの」である。

近年の測定・解析技術の進歩により,研究現場で生産されるデータ量は爆発的に増大している。生命科学分野では,こうした研究データを公的なデータベース(以下DB)に登録することで広く共有する仕組みが存在しており,現在ではDBを利活用することは,研究を行ううえでの必須条件となっている。一方で,生命科学分野において生産されるデータは複雑性や曖昧性を有するため,ただデータをDBに集めるだけでは不十分で,再利用性を高めるための工夫が必要であると指摘されている2)

2. トーゴーの日シンポジウム2017

科学技術振興機構(JST)バイオサイエンスデータベースセンター(NBDC)では,データの共有と再利用を通じて生命科学研究を推進することを目的として,ライフサイエンスデータベース統合推進事業を実施している。その一環として,毎年10月5日を「トーゴーの日」と定め,国内のDB関係者が集まり生命科学分野におけるDBの統合と利活用にまつわる問題をともに考え,議論を深めるためのシンポジウムを開催している。

2017年はサブタイトルを「バイオデータベース:『作る』から『使う』へ」とし,東京大学弥生講堂において10月4~5日の2日間にわたり開催した注1)。このサブタイトルは,ユーザーの視点に立ち,ユーザーと連携してデータの利活用を推進することが,今後のDB統合においてますます重要になるという認識に基づく。本稿では,主催者側の視点からシンポジウムの概要を報告したい。

3. 招待講演

生命科学分野全般においてDBは利用されているが,この先,特に活用が見込まれる分野として,「人工知能」および「ゲノム医療」が挙げられる。招待講演では,それぞれの分野において先進的な取り組みをしている,理化学研究所革新知能統合研究(AIP)センター(兼 東京大学大学院新領域創成科学研究科)の杉山将センター長と,東北大学東北メディカル・メガバンク機構(ToMMo)の山本雅之機構長に登壇いただいた。

杉山センター長による初日の講演では,人工知能研究の歴史を概説するとともに,AIPセンターにおけるデータ科学に関する最新の取り組みが紹介された(1)。近年,海外企業による人工知能分野への巨額の投資が話題になることも多い。講演では,主要な応用研究は予算規模の勝負になりつつあるが,基礎研究は個人勝負であり日本には優秀な理論研究者がいる,との力強い言葉が語られた。AIPセンターの今後の展望として,限られた情報からの精度の高い機械学習法など,理論・基礎研究を推進するとともに,さまざまなパートナーと連携することで,再生医療など日本が強い研究分野をさらに強化するための応用研究にも取り組んでいくことが紹介された。

2日目の山本機構長の講演では,大規模ゲノムコホートの構築と複合バイオバンクの整備を中心としたToMMoの取り組みが紹介された(2)。ToMMo事業では,基礎研究の基盤強化とともに自ら解析研究を実施しているのが大きな特徴であり,その研究成果の一部は,NBDCが構築・運用するヒトデータベースから公開されている。また,コホート構築を通じて得られた情報は,東北メディカル・メガバンク総合データベース(dbTMM)や日本人多層オミックス参照パネル(jMorp)によって,ToMMo自身が発信を行っている。今後の展望として,こうした試料と情報の提供を通じてゲノム医療研究の基盤構築を推進するとともに,東日本大震災被災地における健康管理への貢献や個別化医療・個別化予防の実現に取り組むことが紹介された。

図1 杉山センター長による講演
図2 山本機構長による講演

4. 口頭発表

生命科学分野の研究は目的や対象が多様であり,生産されるデータの種類や形式も多岐にわたる。NBDCではファンディング(統合化推進プログラム)を通じて,さまざまな分野ごとにDB統合を推進している。この統合化推進プログラムの研究課題について,内容紹介と成果報告の口頭発表が9件行われた。発表内容を個別に紹介するには紙面が足りないため,タイトルと発表者を1にまとめた。この表を見ると,生命科学分野におけるDBの多様性の一端を感じてもらえるのではないだろうか。シンポジウムのWebサイトでは,招待講演や口頭発表の講演スライドおよび講演動画注2)をクリエイティブ・コモンズのCC-BYライセンス注3)の下で公開している。興味がある方はぜひ見ていただきたい。

上記の発表はDBを「作る」側によるものであったが,ユーザー発表のセッションでは,「使う」側の研究者によるDBの活用事例が4件紹介された。それぞれの概要は以下のとおりである。

  • ・「KEGG データベースを用いたAI 創薬」山西芳裕氏(九州大学)
  •  代謝パスウェイを中心としたDBと人工知能技術を組み合わせることで,既存薬の新しい効能を発見し,別の疾患治療薬として開発することが可能である。

  • ・「乳児腸内菌叢(きんそう)の形成に影響を与えるビフィズス菌の遺伝特性」松木隆広氏(株式会社ヤクルト本社)
  •  微生物統合DBを用いて乳児における腸内菌叢の形成過程を調べ,腸内細菌と乳児の共生関係の鍵となる遺伝子を明らかにした。

  • ・「NMRによるデータベースの利用」嶋田一夫氏(東京大学)
  •  タンパク質立体構造DBに登録されたデータと核磁気共鳴法を用いた解析結果を組み合わせることにより,タンパク質の機能発現機構を解明することが可能である。

  • ・「公共データベースを活用した昆虫ストレス応答遺伝子の機能解析」天竺桂弘子氏(東京農工大学)
  •  複数の公共DBを活用することで効率的に実験をデザインし,昆虫が強いストレスに対峙(たいじ)した際の生体防御に関与する遺伝子を明らかにした。

シンポジウム来場者を対象としたアンケートでは,興味深かった講演として上記4件のいずれかを挙げる回答が多く,「ユーザー発表を増やしてほしい」との意見も寄せられた。また,「『作る』から『使う』へ」という今年のサブタイトルについても,「よかったので,もう一回同じテーマで開催してほしい」との意見があった。ユーザー発表のさらなる充実により,「作る」側と「使う」側の交流・連携をより促進していきたい。

表1 「統合化推進プログラム」口頭発表リスト
タイトル(発表順) 発表者
多様なオミクス分野を結ぶ糖鎖科学ポータルの開発 木下聖子氏(創価大学)
プロテオームデータベースjPOSTの挑戦 石濱泰氏(京都大学)
データサイエンスを加速させる微生物統合データベースの高度実用化開発 黒川顕氏(国立遺伝学研究所)
個体ゲノム時代の植物ゲノム情報解析 田畑哲之氏(かずさDNA研究所)
生命動態情報と細胞・発生画像情報の統合データベースの現状と今後の展開 大浪修一氏(理化学研究所)
蛋白質構造データバンクのデータ検証高度化と統合化 栗栖源嗣氏(大阪大学)
KEGG NETWORK Version 1:がんのネットワークバリアント 金久實氏(京都大学)
エピゲノミクス統合データベースの開発と機能拡充 沖真弥氏(九州大学)
疾患ヒトゲノム変異の生物学的機能注釈を目指した多階層オーミクスデータの統合 菅野純夫氏(東京大学)

5. ポスター発表

本シンポジウムでは,DB開発者同士の技術交流や開発者とユーザーの意見交換の場として,ポスターセッションを設けている。また,事前に参加者がポスター発表の全体像を把握しやすいよう,ポスター1件当たりスライド1枚,発表時間1分で内容を紹介するライトニングトークを実施している。シンポジウムという名称でありながら,ポスター発表に時間と場所を大きく割いているのも本イベントの特徴の一つである。

今回のシンポジウムでは,DBに関するコミュニティー形成の促進を目的として,国内の生命科学系DB関係者を対象に広くポスター発表を募集した。その結果,昨年より17件多い80件の申し込みがあった。ポスター数が増えたため発表会場を2か所に分けることとなり,参加者には不便をかけたが,どちらの会場でも活発な議論が行われ,非常に盛況であった(3)。

ここでも発表内容を個別に紹介することは控えるが,代わりに,ポスター発表要旨80件の全文から名詞を抽出して作成したワードクラウド(単語を出現頻度に応じた大きさで表示したもの)を掲載する(4)。出現頻度上位には,ゲノムや遺伝子,タンパク質といった生命科学分野の用語とともに,データや情報,データベースといった用語が入っており,「トーゴーの日」の特徴がよく現れている。

ポスターデータについても,永続的な識別子であるDOI(Digital Object Identifier)注4)を付与してシンポジウムサイトより公開しているので,興味がある方はぜひご覧いただきたい。

図3 アネックス会場におけるポスター発表
図4 トーゴーの日2017 ワードクラウド

6. おわりに

NBDCが「トーゴーの日」を開催するのは今回で7回目となるが,参加者数は2日間の合計で292名を記録した。参加登録データの集計によると,所属機関別では大学および公的研究機関からの参加者が約6割と最も多かった。一方で,参加者の1/4程度は民間企業に所属しており,学術界だけでなく,産業界からも少なからず参加があったものと考えている。

今後も,DB開発に関わる研究者・技術者同士の情報交換やコミュニティー形成の場として,また,開発者とユーザーをつなぎ,連携を促進する場として,トーゴーの日シンポジウムをさらに発展させていきたい。もし興味があれば,ご参加いただければ幸いである。

(科学技術振興機構 バイオサイエンスデータベースセンター 森亮樹)

本文の注
注1)  トーゴーの日シンポジウム2017:https://events.biosciencedbc.jp/sympo/togo2017

注2)  講演スライドおよび講演動画:https://events.biosciencedbc.jp/sympo/togo2017/program

注3)  クリエイティブ・コモンズ・ライセンスとは:https://creativecommons.jp/licenses/

注4)  DOIについては,以下の文書を参照されたい。“ジャパンリンクセンターのご紹介”. ジャパンリンクセンター事務局. https://japanlinkcenter.org/top/doc/JaLC_introduction_2.pdf

参考文献
  • 1)  Ranganathan, S. R. "The Five Laws of Library Science". The University of Arizona. http://arizona.openrepository.com/arizona/bitstream/10150/105454/4/Chap1.pdf, (accessed 2017-11-07).
  • 2)  川嶋実苗ほか. “国際的なデータシェアリングの加速と国内の取り組み”. ヒト疾患のデータベースとバイオバンク(実験医学増刊 Vol.35 No.17). 山本雅之,荻島創一編. 羊土社, 2017, p. 23-30.
 
© 2018 Japan Science and Technology Agency
feedback
Top