自然言語処理
Online ISSN : 2185-8314
Print ISSN : 1340-7619
ISSN-L : 1340-7619
文末から解析する統計的係り受け解析アルゴリズム
関根 聡内元 清貴井佐原 均
著者情報
ジャーナル フリー

1999 年 6 巻 3 号 p. 59-73

詳細
抄録
係り受け解析は日本語文解析の基本的な方法として認識されている. 日本語の係り受けは, ほとんどが前方から後方であるため, 解析は文末から文頭の方向へ解析を進める事は効率的であり, これまでもルールベースの解析手法ではいくつかの提案がある. また, 統計的文解析は英語, 日本語等の言語を問わず数多くの提案があり, その有効性が確認されている.本論文では, 上記の二つの特徴を兼ね備えた日本語文係り受け解析を提案し, その実験結果を示し, 有効性を実証する. システムの精度は, 正しい文節解析ができた所から開始した場合, 京大コーパスを使用した実験で係り受け正解率が87.2%, 文正解率が40.8%と高い精度を示している. ビームサーチのビーム幅を調整した実験では, ビーム幅を小さくする事による精度の劣化が認められなかった. 実際にビーム幅が1の際に得られた結果の95%はビーム幅20の時の最良の結果と同一であった. また, N-best文正解率を見た時には, Nが20の時には78.5%という非常に高い結果を示している. 解析速度は, 解析アルゴリズムから推測される通り, 文節数の2乗に比例し, 平均0.03秒 (平均文節数10.0), 最長文である41文節の文に対しては0.29秒で解析を行なった.
著者関連情報
© 言語処理学会
前の記事 次の記事
feedback
Top