情報管理
Online ISSN : 1347-1597
Print ISSN : 0021-7298
ISSN-L : 0021-7298
わが国におけるバイオインフォマティクス人材を取り巻く現状 人材に関するアンケート調査結果
佐藤 恵子白木澤 佳子高木 利久藤 博幸
著者情報
ジャーナル フリー HTML

2014 年 56 巻 11 号 p. 782-789

詳細
著者抄録

科学技術振興機構バイオサイエンスデータベースセンター(NBDC)では,バイオインフォマティクスに関する人材育成のための新たな仕組みを検討するにあたり,2013年1月にアンケート調査を行った。この分野の人材を取り巻く現状や,必要とされている人材像,ならびに人材育成を進めるうえで留意すべきことを把握するためである。回答者のほとんどが人材が不足していると回答した。また,必要としている人材像については,「自分で生物実験系(ウェット)の研究開発を行い,新しい情報技術などを開発できる人材」が最も多い回答となった。また,人材不足の理由として,キャリアパスの未確立が指摘された。

1. はじめに

ヒトのゲノムの全塩基配列を解析するプロジェクトであるヒトゲノム計画(Human Genome Project)が2003年に完了してから10年が経った。このプロジェクトは,日,米,英,仏,独,中の6か国の国際協調のもと,13年の年月と30億ドルの費用をかけて進められ,30億塩基対のゲノムの塩基配列が解読され,その配列内にはおよそ25,000の遺伝子がコードされていることが推定された。その後の10年の間に,ゲノム塩基配列の解読技術は革命的な進歩を遂げ,シーケンサー(塩基配列解析装置)の処理量が増大する1)一方,要するコストは減少してきており,2014年には1時間,100ドルで1人分のゲノム配列を決定できるようになるとの予測もある。

コストの低減により,性能が高いシーケンサーが普及し,ヒトだけでなく,広範な生物種のゲノム塩基配列が解読されるようになった。また,近年のシーケンサーは,遺伝子発現,エピジェネティクス,ゲノムの高次構造などの研究にも応用されている。その結果,膨大かつ多様な配列データが集積されてきている。加えて,イメージング技術も近年急速に進展してきており,生体内での細胞や分子の動態に関連する画像データや定量データ等も蓄積されている。

このような状況において,バイオインフォマティクスが重要な役割を果たすことは自明であり,データ駆動型の研究へのシフトが必要であることが多くの研究者によって認識されてきている。しかし,データが大量,多様であるため,それらのデータの解析やデータの整備が十分に行われておらず,データが十分に活用されていない。この問題の最大の原因は,研究データの整備・活用に関わる,生物学と情報科学の両方に通じたバイオインフォマティクス分野の人材の不足であると考えられる。

科学技術イノベーション総合戦略2)において,「ライフサイエンス系研究成果の統合データベース整備及びそれに必要な高度専門人材の育成」が,また健康・医療戦略3)において,「爆発的に増加している医療関係データや情報等を効果的に活用し,今後のライフサイエンス分野の研究開発を発展させるうえで必要不可欠なバイオインフォマティクス人材の育成とキャリアパスの構築」が重点的に取り組むべき課題として取り上げられ,バイオインフォマティクス人材の育成は,国としても喫緊に取り組むべき課題として認識されている。

独立行政法人科学技術振興機構(JST)バイオサイエンスデータベースセンター(National Bioscience Database Center: NBDC)では,ライフサイエンスデータベース統合推進事業として,①戦略の立案,②ポータルサイトの構築・運用,③データベース統合化基盤技術の研究開発,④バイオ関連データベース統合化4),を推進している。前述のような状況の中,NBDCでは,NBDC運営委員会人材育成分科会(分科会主査:独立行政法人産業技術総合研究所生命情報工学研究センター 藤博幸副研究センター長)を立ち上げ,NBDCの事業においても重要なキーとなる,バイオインフォマティクスに関する人材育成のための新たな仕組みについて検討を重ねてきた。

本稿では,NBDCが,分科会での検討にあたり実施した「バイオインフォマティクス人材に関するアンケート調査」の結果について紹介する。

2. 調査方法

バイオインフォマティクスに関する人材については,研究現場で人材が不足していると指摘されている。本調査は人材育成の検討にあたり,まずは現状を把握するために,①どのような種類のデータがどのように解析されているのか? ②データ活用に際しての問題点は何か? ③どのような人材が必要とされているのか? ④どのように人材を育成すべきか? などを明らかにすることを目的とした。2013年1月11日から2月9日にわたり,インターネットによるアンケート調査を実施した。調査の実施にあたっては,日本バイオインフォマティクス学会や日本分子生物学会等,生命科学分野の関係団体にご協力いただき,Webサイトやメーリングリストで本調査について周知していただいた。

回答者には,職業や専門分野などの回答者の概要に関する情報のほか,生命科学分野の研究現場において扱われている研究データの種類や使用されている機器,研究現場で求められる人材像,バイオインフォマティクス分野におけるキャリアパスなどの設問に回答していただいた。

3. 調査結果

3.1 回答者概要

260名からの回答を得た。回答者は,大学教員が35.4%,民間企業で研究・開発に従事している人が22.7%,ポスドク・任期付研究員が16.9%の順に多かった(1)。また,回答者の専門分野は,バイオインフォマティクスが40.8%,バイオの基礎研究が33.8%の構成であった(2)。

図1 回答者の職業
図2 回答者の専門分野

3.2 研究現場の現状

3.2.1 研究データの種類

生命科学分野の研究現場ではどのような種類の研究データが扱われているのだろうか。今回の調査では,ゲノム関係のデータを扱っているとの回答が最も多く,次いで多かったのがタンパク質関係のデータであった(3)。さらに,ゲノム関係のデータの中では,個別の遺伝子の解析データが一番多かった。また,ゲノム関係のデータについては,次世代シーケンサーを使用しているという回答が最も多く,研究現場において次世代シーケンサーが普及していることが分かる(1)。

図3 扱っているデータの種類
表1 データを取得した機器

3.2.2 研究データの処理

データを生成する生物学的実験を行っていると回答した104名に,どのようにデータの処理を行っているかを尋ねたところ,76名(73.1%)が自分で処理を行っているとの回答であった(4)。また,自分で処理していると回答した76名のうち,73.7%がデータ処理の際,バイオインフォマティクスの専門家の協力が必要であると回答した(5)。データを処理する際に程度の差こそあれ,多くの研究者がバイオインフォマティクス専門家の協力を必要としていることが分かる。

図4 どのようにデータの処理を行っているか
図5 バイオインフォマティクス専門家の協力

また,自分でデータ処理をしていると回答した人に,データ処理の際に困っていることについて,自由記述形式で回答を求めた。主な回答は2のとおりである。コンピューターの性能などのデータ処理環境の問題のほかに,先行事例が少ないことや相談できる相手がいないなどの回答が複数見られた。

表2 データ処理時の問題点

3.2.3 バイオインフォマティクス分野の人材のタイプ分け

バイオインフォマティクス分野の人材といっても,そのカバーする範囲は多岐にわたる。研究者を思い描く方もいれば,プログラマーやデータのアノテーションやキュレーションに関わるような人を思い浮かべる方もいるかもしれない。また,研究者にもさまざまなタイプがいる。アルゴリズムや情報技術を開発し,データ解析を行い,生物学的な問題を解く人もいれば,データ解析だけでなく,生物学的な実験も行う人もいる。そこで,不足している人材についてアンケートを行うにあたり,バイオインフォマティクス分野の人材のタイプ分けを行った。まず「基礎/応用研究の研究者」と研究者の支援的な役割を果たす「支援的研究者」の2タイプに分けた。「基礎/応用研究の研究者」は,生物実験を行わない情報学系(ドライ),生物実験系(ウェット),そして,両方を行う,ドライ+ウェットの3つにグルーピングした。さらに3つのグループを問題解決能力で細分化した。例えば,カテゴリー1のタイプはアルゴリズムや情報技術の開発もするし,生物学的な問題を解くことができる人,カテゴリー2のタイプはアルゴリズムや情報技術を開発できるが,生物学的な問題については生物系の研究者と共同で解くような人,そして,カテゴリー3のタイプは既存の情報技術を使って,生物学的な問題を生物系の研究者と共同で解く人である(3)。

表3 バイオインフォマティクスの分類

3.2.4 求められる人材

不足している人材について尋ねたところ,人材が不足していないとの回答はわずか8%で,ほとんどの回答者が11のタイプの中のいずれかの人材が不足していると回答した。不足しているとの回答数が一番多かったのが,カテゴリー4(自分でウェットの研究開発を行い,新しい情報技術,DB,アルゴリズムを開発できる)であった。次いでカテゴリー1(自分で生物の問題を発見し,定式化し,必要に応じて新規のアルゴリズム,情報技術やDBを開発し,問題を解くことができる),カテゴリー8(カテゴリー1~5の研究者と協力して,プログラムを作り,支援的な研究開発ができる)との結果であった(6)。

図6 不足している人材

専門分野がバイオインフォマティクスの回答者とバイオ系の回答者(専門分野がバイオ(基礎研究),医薬,診断薬,食品,農業,化学,医学(基礎研究),医学(応用研究)のいずれかと回答した人)に分けて不足している人材について調べたところ,1~3位までの傾向は同じであった(4)。

表4 専門分野別の不足している人材

人材不足の理由としては,「バイオインフォマティクス系の研究者のキャリアパスが確立されていない」を回答として選んだ人が一番多かった。次いで「生物系の研究者が情報技術,DB,アルゴリズムについて知る機会が少ない」,「大学等でバイオインフォマティクスの教育・研究をしている専攻や学科が少ない」との回答が多かったが,選択肢としてあげた他の理由への回答も少ないものではなく,人材不足がさまざまな要因に起因することが確認できた(7)。

図7 人材不足の理由

3.2.5 人材の教育機能

人材が不足していると回答した239名に,不足している人材を教育できる機能があるかを尋ねたところ,「ある」が15.1%,「あるが不十分」が36.8%,「ない」が48.1%,の結果であった。

また,教育機能が「ある」または「あるが不十分」と回答した方にその原因を自由記述形式で回答を求めた。主な回答は5のとおりである。原因として,実験系研究者が必要と考える人材像とバイオインフォマティクス分野で育成された人材のミスマッチ,人材が必要な状況であるが人材育成に対して投資できないなどがあげられた。

表5 教育機能があるが,人材が不足している原因

3.3 キャリアパス

人材育成を検討する際に,見過ごすことのできないのがキャリアパスの問題である。今回のアンケートにおいても,人材が不足している理由として一番多くの回答があったのが,キャリアパスの未確立であった。

この問題に関連して,バイオインフォマティクス分野で希望する職に就くための知識,スキルについての調査結果について紹介する。これは,回答者のうち,20~30代で,これから就職,転職を予定している人に限定した設問項目であり,89名から回答を得た。主な回答は6のとおりであった。バイオインフォマティクスの職に就きたいと考えている若い人達は,データを扱うための知識や技術に加え,コミュニケーション能力を身に付ける必要があると考えていることがわかった。

表6 バイオインフォマティクス分野で希望する職に就くための知識,スキル

4. まとめ

生命科学分野の研究分野においても次世代シーケンサーデータをはじめとする研究データが大量に生成されるようになった。これらの研究データの整備・活用は,データ駆動型の新たな研究の推進に寄与することが期待される。

今回のアンケート調査によって,生命科学分野の研究現場で扱われているデータは次世代シーケンサーデータが多いことが確認され,それらのデータに対するデータ処理のニーズが高いことが示唆された。また,自分でウェットの研究開発を行い,新しい情報技術などを開発できる人材が研究現場で最も求められている人材像との結果となった。

JSTでは,今回のアンケート結果,そして,実験研究者やバイオインフォマティクス関係者へのインタビュー結果などを踏まえて,生命科学分野で必要とされているバイオインフォマティクス分野の人材像を整理し,研究現場で活躍できる人材をオン・ザ・ジョブトレーニングで育成していく仕組みを検討しているところである。育成された人材によって,研究データが一時的ではなく,継続的に整備・活用され,更には研究者間で共有されることにより,効率的に新たな成果・発見が生み出され,生命科学分野の研究開発が加速することに貢献したいと考えている。

今回紹介したアンケート調査結果は,NBDCのWebサイトで公開している5)。本稿ではそのすべてを紹介することはできなかったので,ご覧いただき,ご意見をいただけると幸いである。

謝辞

本アンケート調査の実施および人材育成の仕組みの検討にあたり,NBDC運営委員会人材育成分科会委員に多大なるご協力をいただいた。また,アンケートにご回答いただいた皆様に感謝を申し上げたい。

参考文献
 
© 2014 Japan Science and Technology Agency
feedback
Top