主催: 一般社団法人 人工知能学会
会議名: 2024年度人工知能学会全国大会(第38回)
回次: 38
開催地: アクトシティ浜松+オンライン
開催日: 2024/05/28 - 2024/05/31
駄洒落は,音韻的に類似しながらも意味の異なる単語を組み合わせて文章を形成する言葉遊びである.駄洒落を作るには,単語の意味と発音に対する深い理解が必要となる.本研究では学習済み言語モデルに対し,日本語の読みを考慮したファインチューニングを行うことにより,日本語の文章を意味を変えずに駄洒落に変換するモデルを構築する.振り仮名注釈付きコーパスと駄洒落データベースを活用して言語モデルをファインチューニングし,日本語の読み方の理解と駄洒落作成への応用能力をモデルに与える.実験の結果,日本語の読み方を理解していないモデルを駄洒落データセットでファインチューニングした場合と比べ,提案手法は BLEU スコアが 0.03 ポイント改善した.