人工知能学会全国大会論文集
Online ISSN : 2758-7347
第39回 (2025)
セッションID: 1Q3-OS-35-05
会議情報

マルチモーダル生成AIを用いた多数の視覚要素を含むWebデザインの生成手法
*村田 達郎中田 百科薬師寺 政和高橋 諒
著者情報
会議録・要旨集 フリー

詳細
抄録

本研究では、多数の視覚要素を含む複雑なWebデザインを自動生成する新たな手法を提案する。ここで視覚要素とは、Webデザイン上の写真やロゴなどの画像に関する情報を指す。Webデザインの自動生成は、システム導入の迅速化、開発コストの削減を実現する技術として注目されている。近年のマルチモーダル生成AIの進展により、画像を基にHTMLコードを生成する技術が研究されてきた。しかし、これまで視覚要素を含めたHTMLコードの自動生成の取り組みは少なく、視覚要素の正確な情報取得と適切なレイアウト配置が課題であった。そこで本研究では、文書解析に特化した物体検出モデルを用いて視覚要素を精密に認識する。次に、視覚要素の位置情報と画像情報を活用し、マルチモーダル生成AIにより適切なレイアウト配置を実現するHTMLコードを自動生成する。本研究では、提案手法を飲食メニュー画像を対象とするWebデザイン自動生成タスクに適用し、有効性を実証した。

著者関連情報
© 2025 人工知能学会
前の記事 次の記事
feedback
Top