2023 年 2023 巻 Challenge-063 号 p. 01-
遠隔マイクによって録音された音声から「誰が」「何を」「いつ」話したかを正確に認識する技術は,自動議事録作成や対話ロボットなどの実現のために必須 である。しかし遠隔収録された会話音声には雑音や残響が重畳しているだけでなく,複数話者の音声の重複が頻繁に観測されるため,単独話者向けもしくは近接 マイク向けに開発された従来の音声認識モデルは適切に動作しない。本講演では,遠隔マイクもしくはマイクアレイを用いてリアルタイムに複数話者の会話を音 声認識し話者決定するための各種の取り組みについて紹介する。