主催: 一般社団法人 人工知能学会
会議名: 2023年度人工知能学会全国大会(第37回)
回次: 37
開催地: 熊本城ホール+オンライン
開催日: 2023/06/06 - 2023/06/09
AIソフトウェアは従来のソフトウェアとは異なり,学習データから帰納的に開発されるため,高品質なデータセットを用意することが重要である.これまで我々は,複数の観点での潜在変数を抽出可能な変分オートエンコーダを利用して,潜在変数及び対応するデータの可視化により,データセットの多様な属性情報を取得可能な品質評価手法を提案している.そこでは潜在変数と属性の対応付けをユーザが手動で実施するため,手間がかかり属性値の定量化が困難という問題があった.そこで本稿ではその変分オートエンコーダを改良して,潜在変数から属性値を自動かつ定量的に予測可能な半教師あり表現学習手法を提案する.提案手法ではデータセットの一部に含まれる教師データの潜在変数から属性値を回帰予測できるように,損失関数に回帰式の適合度の指標である決定係数を含む項を追加し,決定係数が高くなるように学習する.帳票の手書き文字データセットに本手法を適用した結果,文字の太さや画数を予測可能な潜在変数を生成し,データセットの属性値別の出現頻度を把握してデータセットの客観的な品質評価に有効であることが分かった.