主催: 一般社団法人 人工知能学会
会議名: 2025年度人工知能学会全国大会(第39回)
回次: 39
開催地: 大阪国際会議場+オンライン
開催日: 2025/05/27 - 2025/05/30
環境音認識は周囲の状況を把握する上で重要な技術であり、近年ではVision Transformerの枠組みを活用した手法が注目されている。しかし、Transformerモデルはデータが不足すると過学習が起きやすく、また事前学習済みモデルが、目的の音環境に適合しない事もある。一方、CNNは事前学習なしかつ少量のデータでも安定した性能を発揮し、畳み込み処理によるデノイジング機能によってノイズの影響を軽減出来るという利点を持つ。そこで本研究では、CNNのノイズ耐性に着目し、最適なCNNの選定とデータ拡張手法の導入を検討した。まず、実績のある5種類のCNNを比較し、次にデータ拡張手法としてCutMixを導入してノイズを含むデータでの性能向上を図った。その結果、EfficientNetが優れたノイズ耐性を示し、CutMixが認識性能全体を向上させる事を確認した。本結果は、高精度かつノイズに強い環境音認識モデルの実用化に資すると考える。