主催: 一般社団法人 人工知能学会
会議名: 2022年度人工知能学会全国大会(第36回)
回次: 36
開催地: 京都国際会館+オンライン
開催日: 2022/06/14 - 2022/06/17
ソーシャルロボットが画像入力より得られる周辺状況に基づいた発話を行う際,駄洒落等のユーモアを付加できれば,エンターテインメント性が向上すると考えられる.そのため,本研究では既存のキャプション生成モデルやオブジェクト検出を活用し画像に合った駄洒落文を選択するためのランキング手法を提案する.提案手法では, STAIR Captionデータセットより学習した日本語キャプション生成モデルよりプレーンキャプションを生成し、得られたキャプションから重要語及び他の形態素を抽出する.このようにして得られた単語に対して,物体検出及び重要語抽出の結果の語がより大きな値を持つように重み付けする.出力として駄洒落データベースにおいて重みの和が最大となる駄洒落文を選択する.主観評価実験では,MSCOCOデータセットからランダムに選択した10枚の画像に対して提案手法を用いて各画像に合った駄洒落文を選択し,10名の被験者に「駄洒落文が画像に対して適切であるか」を質問し,5段階評価を行ってもらった.その結果,評価値の平均は 3.11であり「どちらともいえない」を若干上回る結果が得られた.