抄録
完全なゲノム配列の再現を目指す上で最も有効な手段は、ロングリードデータの利用である。第 7 回は、ロングリードの代表格である PacBio データを用いた、乳酸菌ゲノム配列決定について述べる。PacBio データの概観、PacBio データ用のアセンブラである HGAP(Hierarchical Genome Assembly Process)の実行、得られたコンティグの概観・検証(クオリティスコア分布、ドットプロット、および BLAST)、重複領域の除去(環状化)など、一連の手順を解説する。ウェブサイト(R で)塩基配列解析(URL:http://www.iu.a.u-tokyo.ac.jp/~kadota/r_seq.html)中に本連載をまとめた項目(URL:http://www.iu.a.u-tokyo.ac.jp/~kadota/r_seq.html#about_book_JSLAB)が存在する。ウェブ資料(以下、W)や関連ウェブサイト、および DDBJ Pipeline 実行結果ファイルなどを効率的に活用してほしい。