自然言語処理
Online ISSN : 2185-8314
Print ISSN : 1340-7619
ISSN-L : 1340-7619
コーパスからの語順の学習
内元 清貴村田 真樹馬 青関根 聡井佐原 均
著者情報
ジャーナル フリー

2000 年 7 巻 4 号 p. 163-180

詳細
抄録

本論文では, 日本語の語順の傾向をコーパスから学習する手法を提案する. ここで語順とは係り相互間の語順, つまり同じ文節に係っていく文節の順序関係を意味するものとする. 我々が提案する手法では, 文節内外に含まれるさまざまな情報から語順の傾向を自動学習するモデルを用いる. このモデルによって, それぞれの情報が語順の決定にどの程度寄与するか, また, どのような情報の組み合わせのときにどのような傾向の語順になるかを推測することができる. 個々の情報が語順の決定に寄与する度合は最大エントロピー (ME) 法によって効率良く学習される. 学習されたモデルの性能は, そのモデルを用いて語順を決めるテストを行ない, 元の文における語順とどの程度一致するかを調べることによって定量的に評価することができる. 正しい語順の情報はテキスト上に保存されているため, 学習コーパスは必ずしもタグ付きである必要はなく, 生コーパスを既存の解析システムで解析した結果を用いてもよい. 本論文ではこのことを実験によって示す.

著者関連情報
© 言語処理学会
前の記事 次の記事
feedback
Top