2015 年 57 巻 10 号 p. 769-775
ICSTI(International Council for Scientific and Technical Information,国際科学技術情報評議会)は科学技術情報流通を目指している国際的な評議会である。2014年11月現在で米国議会図書館,NRC(National Research Council Canada)傘下のCISTI(Canada Institute for Scientific and Technical Information),CODATA(Committee on Data for Science and Technology),NIH(National Institutes of Health)傘下のNLM(National Library of Medicine),またアジアからは日本のJST(科学技術振興機構)のほか,韓国のKISTI(韓国科学技術情報研究院),中国のISTIC(中国科学技術信息研究所),さらには民間企業であるマイクロソフトリサーチ等,世界で42の科学技術情報機関が参加している。
ICSTIの前身である国際科学会議抄録機関会議(ICSU AB)は,国際科学会議(ICSU)傘下の1機関として,1953年にベルギーで設立されたが,その基本目的は研究者・技術者間の科学技術情報の提供と流通を改善することにあった。その後,民間情報提供機関等の参加も契機となり,1984年にICSU ABは,ICSUから独立したICSTIとして衣替えし,これまでの検討事項に加えて,イノベーションの創造に貢献する科学技術情報のあり方を検討するとともに,研究データの流通に関する諸問題にスポットを当てるようになってきている。JSTは前身であるJICSTが1973年にICSU ABの正式メンバーとなって以来,ICSU AB,およびICSTIの活動にかかわってきた。
今回の「ICSTI 2014 in Tokyo 年次会合 & シンポジウム」は,これらの活動の1つの節目として,JSTがアレンジし,運営,開催することになったものである(図1)。
10月18(土),19日(日)の2日間にわたり日本科学未来館においてICSTIの年次会合を開催した。年次会合は,(1)会の運営面を討議する総会(General Assembly),(2)科学技術情報を流通させるための技術的課題を意見交換し,プロジェクトを構築・運営するためのTACC(Technical Activities Coordinating Committee)会議,(3)科学技術情報に係わる最新動向を意見交換するITOC(Information Trends and Opportunities Committee)会議から構成されており,主にICSTIのメンバーを中心としたものである。
TACC会議,およびITOC会議では,計7名の内外有識者を招き,各会議の設定趣旨に沿って発表していただいた。
両会議における発表を通して,政策提言に資する情報の収集,研究データの流通・活用に関する活動,研究開発の評価に利用できる新たな識別子の提案など,科学技術情報にかかわる機関にとって興味深い話題を検討し,討議することができた。また,多くの発表者がアジア地域だったため,その方々とICSTIの会員機関とのパイプを構築することができた。
次章では,TACC会議,ITOC会議で特に注目した発表について報告する。
当会議では,中国科学アカデミー国家科学図書館のDr. Zhixiong Zhangから興味深い発表をいただいた。同図書館では,米国,欧州等主要国が発行する報告書,戦略書,科学技術指標等の情報を,インターネットで体系的に収集し,それを機械的に整理し,可視化することで,中国科学アカデミーおよび中国の政府機関での科学技術戦略の策定に活用している。
調査対象としているのは,米国OSTP,英国RCUK,米国DOE,米国NSF,米国NASA,米国NIH等であり,それらの機関がインターネットを通じて発行している資料をクローリングして収集している。収集した資料は,テキストマイニング技術(図2)を使って,その文書がもつ主題を機械的に抽出し,それをもとにして収集した資料の整理・体系化を行う。それらの情報を中国語に機械翻訳するとともに,その情報に有益性の評価を加え,Webで公開している(図3)。また,それらの情報を可視化して表示する機能も有している。
シンポジウムは,メインテーマを「Information and Infrastructure for Innovation(3i)」~New Approaches for Knowledge Platforms~として,ICSTI会員以外の一般の方々にも参加いただき,10月20日(月),21日(火)の2日間にわたり,日本科学未来館にて開催した。
各セッションの内容は,セッション1:データ共有のためのオープンプラットフォーム,セッション2:科学技術情報に関わる新技術と新サービス,セッション3:科学技術情報に基づく分析と評価とし,発表者として合計14名の内外有識者を招聘(しょうへい)した。
JSTは,このシンポジウムを運営・開催するにあたり,国内の科学技術情報に関心をもつ機関,研究者,企業の方々に対し,各セッションの国内外の最新情報を発信するとともに討議を行う機会を提供することを考えた。また,議論を有益なものとするため,国内の有識者にも参加いただいた。今回は,2日間で延べ約300名が出席され,有益な意見交換ができたと考えている。14名の有識者による発表は,科学技術情報に関係した最新の動向を伝えるものであった。次項からその内容を紹介する。
4.1 セッション1に関するトピックセッションテーマ:データ共有のためのオープンプラットフォーム
座長:恒松直幸 JST上席主任調査員
(1) 概要(i) Dr. Jeffrey Salmon(米国エネルギー省科学局):Open Platform for Public Access Policy and Data Sharing: The Experience of the Department of Energy
(ii) Dr. Chris Greer(米国国立標準技術研究所):International cooperation and coordination for an interoperable, global research data infrastructure
(iii) Dr. Wolfram Horstmann(独ゲッティンゲン大学):Data Libraries
(iv) Dr. Mustapha Mokrane(国際科学会議世界科学データシステム):ICSU World Data System: Trusted Data Services for Global Science
(v) 村山泰啓 博士(情報通信研究機構):Research data sharing and frameworks
このセッションでは,研究データの共有にかかわる現在の状況,および,それにかかわる諸問題を討議した。2013年のG8科学大臣およびアカデミー会長会合で,研究データのオープン化が提唱されて以降,その議論が活発化している。各発表では,そのような状況を背景として,所属する機関でのオープン化に関する状況,オープン化のためのプラットフォームや,流通のルール化などについて発表があった。このセッションの結果,科学技術研究の世界でも,ビッグデータの波が到来しており,科学技術研究の形態がデータ駆動型に変わる可能性があること,欧米のファンディング機関は,研究データを含む研究成果の共有ポリシーを制定しており,それを実現する共有プラットフォームを,ファンディング機関や研究機関,大学図書館等が構築していることが確認できた。次に発表のうちのいくつかを紹介する。
(2) Dr. Chris Greerの発表Dr. Greerは,ビッグデータにより,今まで考えていなかったことを知りうる時代がきており,科学技術研究がデータ駆動型に変わると言われていることを紹介した(図4)。その一方で,管理すべきデータが膨大になっており,その量が世界で用意できる記憶装置の容量を超える可能性があることから(図5),データをキュレートすることが重要になっている。そのため,科学的な研究を進める側では,今が研究データの共有を進めるときであり,世界のインフラの構築を自発的かつ連携して進めるべきであると述べた。
Dr. Horstmannは,所属する大学における研究データを管理するプラットフォームの構築について紹介した。
欧米各国では,研究データの共有に関するポリシーが確立されつつあり,英国のDCC(Digital Curation Centre)の調査を例として,各ファンディング機関の研究データ,論文の共有ポリシーを紹介した(図6)。そうした状況を受けて,独ゲッティンゲン大学では,研究データの共有を促進するため,各分野の代表によりeResearchアライアンスを構成し,共通の課題を検討しており,その結果をITサービスに落とし込み,図書館に共通的なインフラを構築している(図7)。
Dr. Mokraneは,同氏が事務局長を務める国際科学会議世界科学データシステムから見た研究データの共有にかかわる現況を発表した。
まず研究データは,大規模実験設備から産出され,管理されe-infrastructureで公開されるようなビッグデータと,個々の研究者が産出し公開されない研究データとで,ロングテールを構成する(図8)。
今後の科学研究においては,それらのデータを組み合わせて研究を進めることが理想であり,データの公開フロー等の整備が期待されている(図9)。
セッションテーマ:科学技術情報に関わる新技術と新サービス
座長:林和弘 氏 科学技術・学術政策研究所 上席研究官
(1) 概要(i) Mr.Alex D Wade(マイクロソフトリサーチ):From Data to Decisions: New opportunities for data driven research and machine learning
(ii) 松邑勝治(科学技術振興機構):JST's activities to contribute to knowledge infrastructure in Japan
(iii) Dr. Ying Li(中国科学技術信息研究所):STKOS Development & Its Application Service in ISTIC
(iv) 黒川顕 博士(東京工業大学):"Small Bugs, Big Data": Developing an integrated Database for Microbes with Semantic Web Technologies
(v) 大向一輝 博士(国立情報学研究所):Linked Open Innovation: Current Status and Future Prospect of Open Data
このセッションでは,「科学技術情報に関わる新技術と新サービス」と題し,情報流通の世界で日々開発される新たな技術やサービスについて発表していただいた。
このセッションを通じて,さまざまなデータを組み合わせて,新たな知見を得るための研究や活動をするためには,利用するデータが機械判読可能で,かつ標準的なフォーマットで記述される必要があること,さらに,さまざまなデータをつなげるためには,そのデータで使用される語句や項目が統一される必要があり,その目的達成にオントロジーやシソーラス等の言語資源があることが確認された。
(2) 黒川顕 博士の発表黒川博士は,バクテリアの研究を進めるため,バクテリアをゲノムレベルでメタデータ化してデータベース化することが必要であり,メタデータレベルでの比較研究により,バクテリアの性質が特定できるとの紹介があった。
こうした研究を進める場合,作成するメタデータを交換し,機械判読が可能な形で効率的に利用するため,RDFのような標準的なフォーマットでメタデータを作成することと,そこで利用する語句のオントロジーを作成して,言葉の定義を明確化することが必要であるとした(図10,図11)。
ただしオントロジーは,目的とする研究により異なる構成が必要であり,また機械化も現状では困難な場合が多く,多くの時間を要する手作業になることが多い。またメタデータ自体も,拡張が必要であることが多く,複雑化することもある(図12)。
セッションテーマ:科学技術情報に基づく分析と評価
座長:Mr.Todd Carpenter 米国情報標準化機構(NISO)事務局長
(1) 概要(i) 治部眞里(科学技術振興機構/経済協力開発機構):Knowledge flows ‒ Science for innovation
(ii) Dr. Hong-Woo Chun(Korea Institute of Science and Technology Information):KISTI Technology Opportunity Discovery Service
(iii) Dr. Ismael Rafols(University of Sussex):Towards indicators for 'opening up' science and technology policy
(iv) 山口栄一 博士(京都大学):Structures of creating breakthrough innovation
このセッションでは,科学技術情報に基づく分析と評価について発表が行われた。政策のための科学や企業における研究開発戦略立案では,エビデンスをより重視する動きがあり,ここでは評価分析活動についての発表や討議を行った。
4名の方々に発表していただいたが,京都大学の山口博士の発表を次項に紹介する。
なお,JST/経済協力開発機構の治部の発表であるKnowledge flows-Science for Innovationについての詳細は,『情報管理』vol. 56(2013) no. 7からの連載1)~8)を参照いただきたい。
(2) 山口栄一 博士の発表山口博士は,イノベーションが起こる過程を分析し,イノベーションを創造するための諸施策について提言を行った。
まず,イノベーションが起こる過程を分析し,イノベーションが起こるためには,既存技術から知識に帰納(Induction)し,その知識から新たな知識を創発(Abduction)する概念が鍵となることを示した。また,知識が個別技術に移行することは,演繹(えんえき)(Deduction)という概念(図13)になり,さらに知識が他分野に波及して,新たな知識を生む場合は,回遊(Transilience)という概念になる(図14)。さらにこの定義で,いくつかのイノベーション事例についてモデル化を行った。
次に,科学技術研究の各分野の関係性を示す学術俯瞰(ふかん)図を示し,米国,日本両国のSBIR(Small Business Innovation Research)政策で投資している分野を比較し,両者の違いを解説した(図15)。日本のSBIR政策における基礎研究の充実についても示唆に富む発言があった。
今回の年次会合におけるTACC会議,ITOC会議,およびシンポジウムの開催を通じて多くの識者の発表を聞くことができ,また活発な質疑応答・討議の中で多くの知見を得られたことは大変有意義であった。
特に,新たな知見を得るために,私たちを囲むさまざまな領域でビッグデータの時代がきており,ビッグデータによる研究開発は,効率的かつ効果的にイノベーションに貢献すると確信するものであった。
最後に,「ICSTI 2014 in Tokyo 年次会合 & シンポジウム」開催にあたって発表いただいた内外の先生方,座長を快諾いただいた皆さま,ならびにご来賓の皆さま,会場にお越しいただいたすべての皆さまに心より御礼申し上げます。
(科学技術振興機構 藤平俊哉)