情報管理
Online ISSN : 1347-1597
Print ISSN : 0021-7298
ISSN-L : 0021-7298
情報界のトピックス
ジャーナル フリー HTML

2016 年 59 巻 5 号 p. 353-355

詳細

米国でがんゲノム・臨床データのオープンアクセスデータシステム開設

米国立衛生研究所(NIH)は6月6日,研究者間でのがんのゲノムおよび臨床データの共有を推進するオープンアクセスデータシステム「Genomic Data Commons(GDC)」を立ち上げたと発表した。GDCは,米政府が主導する「米国がんムーンショットイニシアチブ」および「個別化医療イニシアチブ(PMI)」の中核要素と位置付けられている。NIH傘下の国立がん研究所(NCI)の主導で,シカゴ大学データ集約型科学センターが運営を行う。開設にあたって,6日にはバイデン副大統領がシカゴ大学を訪問し,「データにアクセスできる研究者を増やし,より短時間でデータを解析して,新たなパターンを発見できるようにすることは,患者の命を救う治療法の開発を加速するのに不可欠だ」とする声明を発表している。

GDCには当初,NCIが実施している,TCGA(がんゲノムアトラス)やTARGET(小児がん研究プロジェクト)といった既存の大規模プロジェクトからの約1万2,000人分のゲノムおよび臨床データが収録される。さらに今後,世界中の研究者が自らデータを登録できるようにする。データには,がんの分子組成や,用いられた治療法,その治療効果についての情報などが含まれる。研究者はGDCのシステムを使って必要なデータを検索できる。未加工の生ゲノムデータの提供を特徴としているため,新しい計算ツールや分析手法が開発された際に,研究者がゲノム情報を再分析することが可能になっている。

JISCなど,研究成果公開等に関する研究者の意識を調査

英国研究図書館コンソーシアム(RLUK)と英国情報システム合同委員会(JISC)は6月15日,英国の高等教育機関の研究者約7,000人を対象にした調査の報告書「UK Survey of Academics 2015」を公表した。これによると,研究者の88%は,所属大学の図書館の蔵書や講読論文雑誌がデータや情報源として重要だと考えていると答えた。また,46%の研究者は,自分の研究成果を一般の人々に公開することが重要だと考えており,この割合は前回調査(2012年)から48%増加している。研究データをオンラインリポジトリに保存した研究者は前回より53%増加している。また,67%の研究者が,過去に発表した論文をオンラインで利用可能にする際に,大学図書館などからの支援を受けたとしている。

アジア大学ランキング2016が発表

Times Higher Educationは6月20日,「アジア大学ランキング2016」を発表した。1位がシンガポール国立大学,2位が南洋理工大学と,シンガポールの大学が1,2位を占めた。前年1位だった東京大学は7位。中国と日本は,同数の39機関が評価対象となっているが,トップ100に入った大学の数では,中国が22機関に対して日本は14機関と開きがある。Simon Marginson教授(ユニバーシティー・カレッジ・ロンドン)は,中国の台頭と日本の競争上の地位低下は,5年前からすれば大きな変化だと指摘している。その原因については,日本がここにきて過去20年間にわたる大学予算削減の影響を受けている一方で,中国は「C9」と呼ばれるトップ大学9校によるアライアンスを設立していることを挙げている(9校のうち6校が今回の上位30位以内に入っている)。Times Higher Educationのアジア大学ランキングは,毎年発表されている世界大学ランキングと同様に,「教育」「研究」「論文引用」「国際性」「産業界への知識移転」という5カテゴリーで,13の指標を用いて算出されている。

ディープラーニングの活用により言語に依存せず,賛成・反対意見を提示するシステム

日立製作所は6月2日,日本語での論理的な対話を可能にする人工知能の基礎技術の一つを開発したと発表した。この技術は,賛否が分かれる議題について,大量の日本語記事の中から賛成・反対双方の立場から,意見の根拠や理由に該当する文を識別する。これまで,大量の英語記事を分析し,英語で意見を提示する人工知能の基礎技術を開発してきたが,今回開発された技術では,ディープラーニングを用いることで言語別の専用プログラムが不要になり,さまざまな言語に対応する汎用(はんよう)システムの構築が可能になった。この技術を基礎にして,企業のグローバルな経営判断を支援する人工知能システムの実現を目指すとしている。

人工知能の倫理とリスク

人工知能が次世代の技術として注目され,さまざまな利用の可能性が検討される中で,そのマイナス面や社会に与える影響についての検討や,研究倫理についての議論が始まっている。

人工知能学会倫理委員会は6月6日,「人工知能研究者の倫理綱領(案)」を発表した。この綱領は,同日から開催された人工知能学会全国大会における公開討論会での意見募集のために作成されたもの。序文では,人工知能が研究開発者の想定し得ない場面で人類に影響を与える可能性を指摘したうえで,人工知能研究開発者は自らの良心と良識にしたがって倫理的に行動すべきだとしている。綱領では人工知能研究開発者が順守すべき事柄として,1)人類への貢献,2)誠実なふるまい,3)公正性,4)不断の自己研鑽,5)検証と警鐘,6)社会の啓蒙,7)法規制の遵守,8)他者の尊重,9)他者のプライバシーの尊重,10)説明責任の10項目を挙げている。

一方,総務省情報通信政策研究所は6月20日,「AIネットワーク化検討会議」の報告書「AIネットワーク化の影響とリスク:智連社会(WINS)の実現に向けた課題」を公表した。同報告書では,AIネットワーク化の進展が産業構造や雇用にもたらす影響として,異業種間の融合の進展や,AIやロボット等による技術的代替,就労者と企業との関係の新たな可能性などを指摘。そのうえで,そうした影響を評価するための指標などについて検討の方向性を整理した。さらに,ロボットを題材としたリスク・シナリオ分析を実施。ファームウェアの乗っ取りなどによる制御喪失といった「機能に関するリスク」のシナリオに加えて,自動走行車による事故のリスクや,ロボットがオレオレ詐欺に利用される犯罪のリスク,さらには人間に投棄された「野良ロボット」が徒党を組んで参政権等の権利を要求するといった,民主主義に関するリスクなど,「法制度・権利利益に関するリスク」のシナリオを提示し,それぞれの生起確率や被害の規模を検討している。

総務省,統計LODを公開

総務省は6月30日,政府統計の総合窓口「e-Stat」において「統計LOD」の提供を開始したと発表した。国勢調査や経済センサスなどの7統計の一部について,LOD(Linked Open Data)形式の統計データを作成し,提供するもの。2015年度に福井県や独立行政法人統計センター等と連携して実施した「オープンデータモデル事業」の成果として位置付けられている。LOD形式は,5段階あるオープンデータ形式の公開レベルで最高ランクとされる。現在の多くのデータ公開方法では,データごとに掲載Webサイトで検索・取得する必要があり,取得漏れの恐れや,データ処理に時間がかかるといった問題がある。LODは,データが相互に関係づけられているため,漏れなく,1回の検索で迅速に取得でき,データ形式も同一のため,取得後のデータ処理も短時間で行えるのがメリットである。

統計LODは,Web上のデータを表現するための統一的な枠組みである「RDF」を利用しており,統計表のセルごとに,観測値(統計表の値),次元(市町村など,観測値を同定するもの),測度(人口など,観測値の対象),属性(人など,測度の単位)を記述する。またインターネット上で公開している,同じ意味を持つ他項目へのリンクを付与することで,データ間連携を可能にしている。データを構成する要素が約3億個あり,イタリア国家統計局(約4,000万個),アイルランド統計局(約2,000万個)などと比べてトップレベルの情報量だとしている。

 
© 2016 Japan Science and Technology Agency
feedback
Top