2025 年 36 巻 1 号 p. 4-12
今回は、アンプリコン解析プログラムであるdada2実行結果のデータ処理について解説する。解析サンプルは19属・22種から構成される疑似微生物群集であり、この情報を再現可能な3種類のDNA抽出キットと4種類の保存バッファの組合せを調べるのが目的である。データ処理の入力は、dada2実行結果(計580個のASV配列、系統推定結果、配列ごとの出現頻度)と正解情報(解析サンプルの系統リスト)である。主な出力は、それぞれの系統に割り当てられたASV配列の出現頻度、および性能評価指標(感度と適合率)である。本稿では、一連のデータ処理の流れを自作関数の利用例を交えて解説する。また、動作確認の重要性を強調するとともに、自作関数中のバグ発見や生物種名のスペルミス発見に至る過程、そしてそれが与えるインパクトについても述べる。