自然言語処理
Online ISSN : 2185-8314
Print ISSN : 1340-7619
ISSN-L : 1340-7619
サポートベクトルマシンを用いた中国語解析実験
吉田 辰巳大竹 清敬山本 和英
著者情報
ジャーナル フリー

2003 年 10 巻 1 号 p. 109-131

詳細
抄録

現在入手可能な解析器と言語資源を用いて中国語解析を行った場合にどの程度の精度が得られるかを報告する. 解析器としては, サポートベクトルマシン (Support Vector Machine) を用いたYamChaを使用し, 中国語構文木コーパスとしては, 最も一般的なPenn Chinese Treebankを使用した. この両者を組み合わせて, 形態素解析と基本句同定解析 (base phrase chunking) の2種類の解析実験を行った. 形態素解析実験の際には, 一般公開されている統計的モデルに基づく形態素解析器MOZとの比較実験も行った. この結果, YamChaによる形態素解析精度は約88%でMOZよりも4%以上高いが, 実用的には計算時間に問題があることが分かった. また基本句同定解析精度は約93%であった.

著者関連情報
© 言語処理学会
前の記事
feedback
Top