意味的類似性にもとづく主観的印象テキストからの画像生成

松岡 竜輝; 熊野 史朗; 今井 倫太; 成松 宏美

doi:10.11517/jsaislud.102.0_223

抄録

近年の画像生成技術の進展により，テキストから画像を生成するText-to-Image(T2I)の性能が大きく向上したものの，ユーザの期待に合った画像を得ることは容易ではない。使用するモデルに合わせてプロンプトを作成しT2Iで画像生成を試みるだけでなく，結果を見てプロンプトを修正し生成を行う作業を繰り返す必要があり，時間と認知負荷がかかる．期待通りの結果が得られない理由の一つとして，ユーザの主観的な印象テキストをT2Iが直接扱えないという課題がある．本研究では，ユーザが期待する画像に対して抱く主観的な印象をテキストでプロンプトに与えることが可能とするために，生成画像の良し悪しを主観的印象テキストの類似性に基づいて判断する手法を提案する．本稿では，生成画像の良し悪しと期待する画像が生成されるまでのトライアル回数について人実験を行った結果から，手法の有効性を示す．

著者関連情報

お気に入り & アラート

閲覧履歴

発行機関からのお知らせ

PDF閲覧時に認証を求められる記事がございます（発行後1年間）が，研究会登録メンバーは無料で閲覧可能です．認証のための購読者番号やパスワードは会員マイページにログインし「お知らせ」にてご確認下さい．メンバー以外の方は，storesにて購入いただけます．

責任著者(Corresponding author)

会議情報

J-STAGEへの登録はこちら（無料）