日本乳酸菌学会誌
Online ISSN : 2186-5833
Print ISSN : 1343-327X
ISSN-L : 1343-327X
総説
次世代シーケンサーデータの解析手法 第3 回Linux 環境構築からNGS データ取得まで
孫 建強三浦 文清水 謙多郎門田 幸二
著者情報
ジャーナル フリー

2015 年 26 巻 1 号 p. 32-41

詳細
抄録

Bio-Linux は、多くの次世代シーケンサー(以下、NGS)解析用プログラムが予め組み込まれたLinux 環境の1 つである。Bio-Linux は、普段利用するホストOS(Windows やMacintosh)ではなく、仮想マシンを導入してゲストOS 上に構築するのが一般的である。連載第3 回は、ホストOS 内にゲストOS(Bio-Linux 8)が存在する感覚を掴めるように、スクリーンショットを例に仮想マシンの概念から説明する。ホスト- ゲスト間でのデータのやりとり(共有フォルダの設定)やBio-Linux 8 の基本的な使い方を述べ、Linux 環境下での乳酸菌ゲノムデータ取得を行う。また、チェックサム、ファイルの解凍と圧縮、コマンドマニュアル、リダイレクトとパイプなど、NGS 解析を効率的に行う上で有用なテクニックを述べる。公共データベース(DB)中の乳酸菌NGS データを概観し、日米欧三極のDB の特徴や注意点を述べるとともに、Lactobacillus casei 12A のトランスクリプトーム(RNA-seq)データ取得を行う。利用可能なハードディスク(HDD)容量の制約など、個々のユーザの置かれたPC 環境下でも、Linux コマンドを組み合わせることで高速かつ効率的に目的を達成することができる。ウェブサイト(R で)塩基配列解析(URL: http://www.iu.a.u-tokyo.ac.jp/~kadota/r_seq.html)中に本連載をまとめた項目(URL: http://www.iu.a.u-tokyo.ac.jp/~kadota/r_seq.html#about_book_JSLAB)が存在する。ウェブ資料や関連ウェブサイトなどのリンク先を効率的に活用してほしい。

著者関連情報
© 2015 日本乳酸菌学会
前の記事
feedback
Top