2005 年 12 巻 2 号 p. 3-23
社会調査において自由回答で収集される職業データの分類 (職業コーディング) に対する, 機械学習手法の一つであるサポートベクタ7マシン (Support Vector Machine, SVM) によるアプローチ及び既存のルールベース手法との組み合わせ方法について検討する.従来, 職業コーディングは人手により行われてきたが, 作業量の多さや煩雑さの問題があり, また, 熟練していないコーダの処理結果には一貫性が欠ける傾向があった.これらの理由から, るようになってきたが, システムの正解率は高いとはいえず, また, ルールベース手法に固有な問題から, 現在の正解率以上にすることは困難であると思われる.そこで, 本稿では, 機械学習の一つで分類性能が高いとされるSVMを適用し, ルールベース手法との比較を行った.さらに, SVMとルールベース手法との有効な組み合わせ方を検討した結果, SVMはルールベース手法より正解率が高く, 両者を組み合わせることでさらに正解率を高めることができることを確認した.また, 本稿では, これからコーディングを行う新しいデータの一部を訓練データとしてフィードバックする場合の効果について実験を行った結果, 新たなデータの一部をフィードバックすることで, 正解率が向上することがわかった.