日本語の仮名表記を学習した言語モデルを用いた文章の言い換えによる駄洒落の生成

南 智仁; 清 雄一; 田原 康之; 大須賀 昭彦

doi:10.11517/pjsai.JSAI2024.0_2G5GS603

抄録

駄洒落は，音韻的に類似しながらも意味の異なる単語を組み合わせて文章を形成する言葉遊びである．駄洒落を作るには，単語の意味と発音に対する深い理解が必要となる．本研究では学習済み言語モデルに対し，日本語の読みを考慮したファインチューニングを行うことにより，日本語の文章を意味を変えずに駄洒落に変換するモデルを構築する．振り仮名注釈付きコーパスと駄洒落データベースを活用して言語モデルをファインチューニングし，日本語の読み方の理解と駄洒落作成への応用能力をモデルに与える．実験の結果，日本語の読み方を理解していないモデルを駄洒落データセットでファインチューニングした場合と比べ，提案手法は BLEU スコアが 0.03 ポイント改善した．

著者関連情報

お気に入り & アラート

閲覧履歴

責任著者(Corresponding author)

会議情報

J-STAGEへの登録はこちら（無料）