人工知能学会研究会資料 言語・音声理解と対話処理研究会
Online ISSN : 2436-4576
Print ISSN : 0918-5682
100回 (2024/02)
会議情報

モンテカルロ木探索を用いた個人性のある画像キャプション生成
吉田 司新堀 和紀深山 篤
著者情報
会議録・要旨集 認証あり

p. 01-06

詳細
抄録

本研究では画像キャプション生成において、個人性を持つ説明文を生成することを目的とする。ここでの個人性には画像に対して注目する観点や、言い回しなどが含まれる。大規模言語モデルの発展に伴い、様々な言語タスクで優れた成果が得られている。文の生成のタスクにおいて個人性を再現しようとした場合、言語モデルを個人から得た学習データから調整することが考えられる。しかしながら個人からのデータの収集には限界があり、少量のデータしか得られないことがほとんどである。そこで本論文では文章生成におけるトークン生成順序の探索について着目し、この探索において少量のデータから学習した個人識別モデルとモンテカルロ木探索を用いることを提案する。実験では一般に用いられるビームサーチと比べて提案手法が幅広い文章を生成できることを示し、また個人性の再現において有益であるを示す。

著者関連情報
© 2024 人工知能学会
次の記事
feedback
Top