次世代シーケンサーデータの解析手法 第 7 回 ロングリードアセンブリ

谷澤 靖洋; 神沼 英里*; 中村 保一; 遠野 雅徳; 大崎 研; 清水 謙多郎; 門田 幸二*

doi:10.4109/jslab.27.101

抄録

完全なゲノム配列の再現を目指す上で最も有効な手段は、ロングリードデータの利用である。第 7 回は、ロングリードの代表格である PacBio データを用いた、乳酸菌ゲノム配列決定について述べる。PacBio データの概観、PacBio データ用のアセンブラである HGAP（Hierarchical Genome Assembly Process）の実行、得られたコンティグの概観・検証（クオリティスコア分布、ドットプロット、および BLAST）、重複領域の除去（環状化）など、一連の手順を解説する。ウェブサイト（R で）塩基配列解析（URL：http://www.iu.a.u-tokyo.ac.jp/~kadota/r_seq.html）中に本連載をまとめた項目（URL：http://www.iu.a.u-tokyo.ac.jp/~kadota/r_seq.html#about_book_JSLAB）が存在する。ウェブ資料（以下、W）や関連ウェブサイト、および DDBJ Pipeline 実行結果ファイルなどを効率的に活用してほしい。

著者関連情報

お気に入り & アラート

閲覧履歴

前身誌

乳酸菌研究集談会誌

責任著者(Corresponding author)

J-STAGEへの登録はこちら（無料）