国立国会図書館件名標目表において,細目を伴った件名標目には代表分類記号が原則付与されていない。国立国会図書館作成の書誌レコードに付与された細目付き件名と日本十進分類法 9版の分類記号の組み合わせの中から,当該件名の代表分類記号となりうるものを機械学習によって同定することを試みた。
まず,出現した件名・分類記号ペアに対して人手によって適切性を判定し,機械学習用の学習・評価用データを整備した。その結果,件名を構成する主標目の代表分類記号と完全一致または前方一致となる分類記号の約 8割が,細目付き件名の代表分類記号として適切と判定された。
機械学習の適用実験では,学習用データの設定において 2つの方式,件名・分類記号ペアの属性群設定において 5つの属性集合,それに 7つの機械学習法という条件を組み合わせた実験とした。実験の結果,機械学習は一定程度の有効性は見せたが,大きく有効との結果を示すまでに至っていない。
抄録全体を表示