ロボットが雑音の存在する実環境で人とコミュニケーションするための,ロバストな音声
インタフェース
を開発した。本
インタフェース
は,(a)音響情報と画像情報の統合による発話区間検出,(b)適応ビームフォーマを用いた音源分離,(c)音声認識におけるモデル適応,の三つのロバスト化技術を統合することにより構成されている。本研究では,このシステムをロボットが利用可能な計算資源でリアルタイムに実現するため,専用ハードウェアRASP-2を開発した。更に実環境での評価・改良を行うため,音声
インタフェース
を利用した,ロボットとネットワークに接続された情報家電の制御を行うアプリケーションを開発し,評価実験を行った。
抄録全体を表示