特許を対象とする画像言語モデル開発のためのデータセットの構築

安藤 一哉; 溝口 月斗; 石川 治樹; 伊豫田 彬; 河野 誠也; 吉野 幸一郎; 野中 尋史

doi:10.11517/pjsai.JSAI2024.0_3Xin2103

38th (2024)

Session ID : 3Xin2-103

DOI https://doi.org/10.11517/pjsai.JSAI2024.0_3Xin2103

Conference information

Host: The Japanese Society for Artificial Intelligence

Name : The 38th Annual Conference of the Japanese Society for Artificial Intelligence

Number : 38

Location : [in Japanese]

Date : May 28, 2024 - May 31, 2024

Dataset Development of Vision-Language Model for Patent Data

*Kazuya ANDO, Tsukito MIZOGUCHI, Haruki ISHIKAWA, Akira IYODA, Seiya KAWANO, Koichiro YOSHINO, Hirofumi NONAKA

Author information

Keywords: Patent, Vision-Language Model, Image Recognition, Multi-Modal, Patent Figure

CONFERENCE PROCEEDINGS FREE ACCESS

Details

Abstract

In this study, we developed a dataset for the development of image-language models of text-drawing pairs in patent documents. Specifically, we created a large image-language dataset by mapping patent drawings to explanatory text using standardized expressions in patents.

Corresponding author

Conference information

Register with J-STAGE for free!