主催: 人工知能学会
会議名: 第96回研究会言語・音声理解と対話処理研究会
回次: 96
開催地: 国立国語研究所
開催日: 2022/12/13 - 2022/12/14
p. 12-
物体検出の結果を用いることで、ユーザが意図する画像中の目的地点を推定する対話システムを構築している。しかし、確信度が低い検出物体を用いると誤解が生じる可能性がある。一方で確信度が高い物体のみを用いると目的地点に近い物体を目印として使えないことがある。そこで本研究では、物体検出の確信度とシステム性能の関係を調査した。物体検出器により画像中の物体の確信度を得て、その閾値をもとに対話に用いる物体を取捨した。システム性能の評価尺度には、推定した目的地点の誤差と推定に要したターン数を用いた。その結果、両方の尺度を考慮した際に最適な閾値が存在することを示した。