人工知能学会全国大会論文集
Online ISSN : 2758-7347
第37回 (2023)
セッションID: 2R4-OS-12-02
会議情報

データセットの品質評価に向けた半教師あり表現学習による属性値の回帰予測手法
*関根 理敏新原 敦介明神 智之今谷 恵理
著者情報
会議録・要旨集 フリー

詳細
抄録

AIソフトウェアは従来のソフトウェアとは異なり,学習データから帰納的に開発されるため,高品質なデータセットを用意することが重要である.これまで我々は,複数の観点での潜在変数を抽出可能な変分オートエンコーダを利用して,潜在変数及び対応するデータの可視化により,データセットの多様な属性情報を取得可能な品質評価手法を提案している.そこでは潜在変数と属性の対応付けをユーザが手動で実施するため,手間がかかり属性値の定量化が困難という問題があった.そこで本稿ではその変分オートエンコーダを改良して,潜在変数から属性値を自動かつ定量的に予測可能な半教師あり表現学習手法を提案する.提案手法ではデータセットの一部に含まれる教師データの潜在変数から属性値を回帰予測できるように,損失関数に回帰式の適合度の指標である決定係数を含む項を追加し,決定係数が高くなるように学習する.帳票の手書き文字データセットに本手法を適用した結果,文字の太さや画数を予測可能な潜在変数を生成し,データセットの属性値別の出現頻度を把握してデータセットの客観的な品質評価に有効であることが分かった.

著者関連情報
© 2023 人工知能学会
前の記事 次の記事
feedback
Top