抄録
室内には様々な音源が存在しており,それらの音の識別を行うことで生活状況の見守りなど多様な応用が期待できる.筆者らは室内で発生する音の時系列データをスペクトログラム画像に変換し,それを転移学習の入力として識別モデルを作成し,環境に存在する各音を推定する手法を検討している.その際に,録音にかけられる労力や必要なデータの種類が多岐にわたることが原因で事前に用意できる音データが限られている.その結果,学習に必要なデータが足りずに十分な識別精度が得られない場合が考えられる.そこで,本検討では室内に存在する単一音,混合音の識別を目的にデータ数が限られている場合における識別精度向上のためのデータ拡張の手法を提案,適用し,その効果を明らかにした結果を述べる.