遠隔マイクによって録音された音声から「誰が」「何を」「いつ」話したかを正確に認識する技術は,自動議事録作成や対話ロボットなどの実現のために必須 である。しかし遠隔収録された会話音声には雑音や残響が重畳しているだけでなく,複数話者の音声の重複が頻繁に観測されるため,単独話者向けもしくは近接 マイク向けに開発された従来の音声認識モデルは適切に動作しない。本講演では,遠隔マイクもしくはマイクアレイを用いてリアルタイムに複数話者の会話を音 声認識し話者決定するための各種の取り組みについて紹介する。
コミュニケーションとは、送信者が発信する信号により受信者が行動を変化させ、結果として送信者が利益を得るような動物個体間の相互作用である。動物の 多様なコミュニケーション行動(社会的促進、情動伝染、援助行動、他者操作、交唱、メタ認知等)についてこの視点で分析し、心を仮定する必要があるのか、 心を仮定することで何がわかるのかを議論する。同様な議論の方法で、人工知能に心を仮定する必要があるかどうかを考える。