人工知能学会全国大会論文集
Online ISSN : 2758-7347
第39回 (2025)
セッションID: 3Win5-47
会議情報

CNNの選定とデータ拡張手法の導入による環境音認識モデルのノイズ耐性向上
*伊藤 吉紀井上 真郷
著者情報
会議録・要旨集 フリー

詳細
抄録

環境音認識は周囲の状況を把握する上で重要な技術であり、近年ではVision Transformerの枠組みを活用した手法が注目されている。しかし、Transformerモデルはデータが不足すると過学習が起きやすく、また事前学習済みモデルが、目的の音環境に適合しない事もある。一方、CNNは事前学習なしかつ少量のデータでも安定した性能を発揮し、畳み込み処理によるデノイジング機能によってノイズの影響を軽減出来るという利点を持つ。そこで本研究では、CNNのノイズ耐性に着目し、最適なCNNの選定とデータ拡張手法の導入を検討した。まず、実績のある5種類のCNNを比較し、次にデータ拡張手法としてCutMixを導入してノイズを含むデータでの性能向上を図った。その結果、EfficientNetが優れたノイズ耐性を示し、CutMixが認識性能全体を向上させる事を確認した。本結果は、高精度かつノイズに強い環境音認識モデルの実用化に資すると考える。

著者関連情報
© 2025 人工知能学会
前の記事 次の記事
feedback
Top