2025 年 18 巻 4 号 p. 267-278
複数の音声やそのほかの音が混ざって収録された音響信号から,個々の音を分離して抽出する音源分離,及び特定の話者の音声のみを抽出する目的音声抽出について,最新の技術動向を解説する.これらの技術は,人にとって音声をより聞き取りやすくするだけでなく,後段の音声アプリケーションの性能向上にも寄与する.二つの重要なアプローチとして,信号のモデルに基づく方法とニューラルネットワークに基づく方法をとりあげる.各アプローチの概要と特徴を述べ,代表的な技術として,残響環境下でのブラインド音源分離と声の特徴に基づく目的音声抽出について詳しく紹介する.最後に,この技術分野の今後の展望についても触れる.