主催: 人工知能学会
会議名: 第100回言語・音声理解と対話処理研究会
回次: 100
開催地: 国立国語研究所 講堂
開催日: 2024/02/29 - 2024/03/01
p. 01-06
本研究では画像キャプション生成において、個人性を持つ説明文を生成することを目的とする。ここでの個人性には画像に対して注目する観点や、言い回しなどが含まれる。大規模言語モデルの発展に伴い、様々な言語タスクで優れた成果が得られている。文の生成のタスクにおいて個人性を再現しようとした場合、言語モデルを個人から得た学習データから調整することが考えられる。しかしながら個人からのデータの収集には限界があり、少量のデータしか得られないことがほとんどである。そこで本論文では文章生成におけるトークン生成順序の探索について着目し、この探索において少量のデータから学習した個人識別モデルとモンテカルロ木探索を用いることを提案する。実験では一般に用いられるビームサーチと比べて提案手法が幅広い文章を生成できることを示し、また個人性の再現において有益であるを示す。