本論文では,音響イベント検出のための新たな評価指標を提案する。環境音分析のタスクの一つである音響イベント検出の従来の性能評価指標では,イベントの種類によらずすべての誤検出が等しく重み付けされる。提案指標では,音響イベントの種類を考慮しながら深刻な音響イベントの誤検出がより大きく罰則される。また,深刻な誤検出が発生し易いあるいは発生しにくい音響イベント検出モデルを用いて,複数の性能評価指標に対する深刻な誤検出の影響を詳細に分析する。実験結果より,従来指標と比較して,提案指標を用いることで,深刻な誤検出の多いイベント検出モデルの性能がより劣化して評価されることを確認した。
本研究では,補聴器に搭載することを目的に,低演算量かつ低遅延な,ディープニューラルネットワーク(DNN)を用いた音声強調について検討する。補聴器に実装可能な演算量と,聴覚的に許容できる遅延時間の範囲内で動作するDNNの構造を複数設定し,学習後の音声強調性能を客観的に評価した。その中で最も高い性能を示すDNNによる強調音声を用いて主観評価実験を行い,難聴者に対しての効果を確認した。実験の結果,同DNNを用いた音声強調処理を施すことにより,難聴者における雑音下での言葉の聞き取りを改善できたことを確認した。