自然言語処理
Online ISSN : 2185-8314
Print ISSN : 1340-7619
ISSN-L : 1340-7619
SENSEVAL2J辞書タスクでのCRLの取り組み
日本語単語の多義性解消における種々の機械学習手法と素性の比較
村田 真樹内山 将夫内元 清貴馬 青井佐原 均
著者情報
ジャーナル フリー

2003 年 10 巻 3 号 p. 115-133

詳細
抄録

本稿では, 2001年に行なわれたSENSEVAL2コンテストの日本語辞書タスクでのわれわれの取り組みについて述べる. われわれは機械学習手法を用いるアプローチを採用した. この研究では数多くの機械学習手法と素性を比較検討し用いている. コンテストには, 我々は, サポートベクトルマシン法, シンプルベイズ法, またそれらの組み合わせのシステム工つの合計4システムを提出し, 組合わせシステムが参加システム中もっとも高い精度 (0.786) を得た. コンテストの後, シンプルベイズ法で用いていたパラメータを調節したところさらに高い精度を得た. 現在もっとも性能の高いシステムは二つのシンプルベイズ法を組み合わせたシステムであり, その精度は0.793である. また, 本稿では素性を変更した実験もいくつか追加で行ない, 各素性の有効性, 特徴を調査した. その調査結果では文字列素性のみを用いても比較的高い精度が得られるなどの興味深い知見が得られている. また, 関連文献も紹介し, 今後の多義解消の研究のための有益な情報を提供した.

著者関連情報
© 言語処理学会
前の記事
feedback
Top