2016 年 54 巻 12 号 p. 873-877
次世代シークエンサー(NGS: next generation sequencer)の活躍によって,さまざまな生命科学の謎が解き明かされている.マイクロアレイ同様,NGSから得られるデータも公共データベースに収めることが論文投稿の条件となってきており,そのデータ量は約3.2ペタバイトにもなっている(ペタは10の15乗).これまでよく用いられてきたBLASTなどの配列類似性による検索手段ではもはや歯がたたず,それぞれのデータの付帯情報であるメタデータをたよりに必要な情報を探し出すことになる.膨大なNGSのデータベースから効率よくデータを取り出し,自らの研究に活用する方策を紹介する.