主催: 人工知能学会
会議名: 第93回 言語・音声理解と対話処理研究会
回次: 93
開催地: オンライン
開催日: 2021/11/29 - 2021/11/30
p. 38-43
多人数会話向け音声対話システムが発話をする詳細なタイミングをself-attentionを用いたアーキテクチャで推定する手法を提案する.音声対話システムの発話タイミングが適切でないと円滑な会話を行うことができない.また,適切な発話タイミングは会話の文脈によって異なる.提案手法はself-attentionを用いたアーキテクチャで複数のモダリティから会話の文脈を捉え,発話タイミングを推定する.