人工知能学会全国大会論文集
Online ISSN : 2758-7347
第37回 (2023)
セッションID: 2H1-OS-3a-01
会議情報

政治資金収支報告書のOCRによる政治資金データベースへの試み
*山田 健太青田 雅輝並木 亮横山 源太朗
著者情報
キーワード: OCR, 政治資金収支報告書
会議録・要旨集 フリー

詳細
抄録

政治資金収支報告書は、政治団体によって提出され、政治資金規正法により公表が義務付けられています。しかし、これらの報告書は多くが手書き文字を含む紙媒体であり、機械判読に適さず、オープンデータの定義を満たしません。そのため、これらのデータをデータベース化することで透明性が向上し、市民による政治的な意思決定への参加が促進されると考えられます。本研究では、政治資金収支報告書の「(その2)収支の状況」に限定し、光学式文字認識(OCR)技術を用いてデータの抽出と整備を行いました。具体的には、2019年に提出された政治資金収支報告書に対し、収支の状況ページからデータを抽出し、データセットを構築しました。また、作成したデータセットを元に分析例を示しました。本研究は、政治資金データベースの作成に向けた第一歩であり、今後も政治資金報告書の形式やデータの改善に取り組むことが求められます。政治資金データベースの構築は、より透明で民主的な社会を実現するための重要な一歩であると考えられます。

著者関連情報
© 2023 人工知能学会
前の記事 次の記事
feedback
Top