人工知能学会研究会資料 言語・音声理解と対話処理研究会
Online ISSN : 2436-4576
Print ISSN : 0918-5682
102回 (2024/11)
会議情報

意味的類似性にもとづく主観的印象テキストからの画像生成
松岡 竜輝熊野 史朗今井 倫太成松 宏美
著者情報
会議録・要旨集 フリー

p. 223-228

詳細
抄録

近年の画像生成技術の進展により,テキストから画像を生成するText-to-Image(T2I)の性能が大きく向上したものの,ユーザの期待に合った画像を得ることは容易ではない。使用するモデルに合わせてプロンプトを作成しT2Iで画像生成を試みるだけでなく,結果を見てプロンプトを修正し生成を行う作業を繰り返す必要があり,時間と認知負荷がかかる.期待通りの結果が得られない理由の一つとして,ユーザの主観的な印象テキストをT2Iが直接扱えないという課題がある.本研究では,ユーザが期待する画像に対して抱く主観的な印象をテキストでプロンプトに与えることが可能とするために,生成画像の良し悪しを主観的印象テキストの類似性に基づいて判断する手法を提案する.本稿では,生成画像の良し悪しと期待する画像が生成されるまでのトライアル回数について人実験を行った結果から,手法の有効性を示す.

著者関連情報
© 2024 人工知能学会
前の記事 次の記事
feedback
Top