自然言語処理
Online ISSN : 2185-8314
Print ISSN : 1340-7619
ISSN-L : 1340-7619
機械学習を用いた日本語機能表現のチャンキング
土屋 雅稔注連 隆夫高木 俊宏内元 清貴松吉 俊宇津呂 武仁佐藤 理史中川 聖一
著者情報
ジャーナル フリー

2007 年 14 巻 1 号 p. 111-138

詳細
抄録

日本語には, 複数の語がひとかたまりとなって, 全体として1つの機能的な意味を持つ表現が多数存在する.このような表現は機能表現と呼ばれ, 日本語文の構造を理解するために非常に重要である.本論文では, 形態素を単位とするチャンク同定問題として機能表現検出タスクを定式化し, 機械学習手法を適用することにより, 機能表現の検出を実現する方法を提案する.Support Vector Machine (SVM) を用いたチャンカーYamChaを利用して, 機能表現の検出器を実装し, 実際のタグ付きデータを用いて性能評価を行った.機能表現を構成している形態素の数の情報, 機能表現中における形態素の位置情報を素性として参照することにより, F値で約92という高精度の検出器を実現できることを示す.

著者関連情報
© 言語処理学会
前の記事 次の記事
feedback
Top