2022 年 2022 巻 Challenge-061 号 p. 05-
本講演では、実環境下でのリアルタイム音声コミュニケーションを支援することを目的として開発中の、ユーザが指定した話者の音声の みを強調し、リアルタイムで認識・翻訳して表示を行うARグラスについて紹介する。ARグラスに搭載されたマイクアレイから得られる 音響信号は、未知の環境における多数の音声・雑音・残響が重畳したものであり、音源の移動、さらにはユーザの移動や頭部の動きに影響 を受けるため、研究室環境のベンチマークとは本質的に難しさが異なる。それでもなお、頑健性と応答性を備えた実用システムを開発する ための技術的なチャレンジについて解説する。