自然言語処理
Online ISSN : 2185-8314
Print ISSN : 1340-7619
ISSN-L : 1340-7619
日本語単語分割を題材としたサポートベクタマシンの能動学習の実験的研究
颯々野 学
著者情報
ジャーナル フリー

2006 年 13 巻 2 号 p. 27-41

詳細
抄録

本論文では, サポートベクタマシンの能動学習が一定以上の複雑さを持つ自然言語処理のタスクに対してどれだけうまく働くかを議論している. 日本語の単語分割をその題材として用いる. 特に, 能動学習のプールのサイズが学習曲線にどう影響するのか議論する. ある精度を達成しようと考えるとき, 大きなプールを用いた場合には, 学習の初期の段階で, 小さなプールを用いた場合よりも多くの正解事例が必要になることが分かった. さらに, プールに徐々にラベルなし事例を加えていくことで, 多数のラベルなし事例を効果的に使う新しい方法を提案する. 実験によれば, 従来手法よりも提案手法のほうが少ないラベル付き事例で済むことが分かった. 97.0%の精度を得るのに, 我々の手法では, 従来の能動学習手法で必要とされるラベル付き事例数の59.3%で済み, ランダムサンプリングで必要とされるラベル付き事例数の17.4%で済ますことができた.

著者関連情報
© 言語処理学会
前の記事 次の記事
feedback
Top