抄録
従来の音声翻訳システムでは、ユーザの発話をリアルタイムに翻訳・音声出力することが可能である一方、翻訳音声の出力中は新たな音声入力を受け付けられないという制約が存在する。このため、ユーザは出力が終了するまで次の発話を待たなければならず、自然な対話を妨げる要因となっている。そこで本研究では、のどの振動を感知するマイクを用いることで、ユーザ自身の声と外部の音声出力を高精度に識別し、翻訳システムにおける非同期な音声入力を可能とする手法を提案する。本システムにより、ユーザは翻訳出力を待つことなく、任意のタイミングで次の発話を行うことができ、よりスムーズでインタラクティブな音声翻訳環境の実現が期待される。