2007 年 14 巻 1 号 p. 111-138
日本語には, 複数の語がひとかたまりとなって, 全体として1つの機能的な意味を持つ表現が多数存在する.このような表現は機能表現と呼ばれ, 日本語文の構造を理解するために非常に重要である.本論文では, 形態素を単位とするチャンク同定問題として機能表現検出タスクを定式化し, 機械学習手法を適用することにより, 機能表現の検出を実現する方法を提案する.Support Vector Machine (SVM) を用いたチャンカーYamChaを利用して, 機能表現の検出器を実装し, 実際のタグ付きデータを用いて性能評価を行った.機能表現を構成している形態素の数の情報, 機能表現中における形態素の位置情報を素性として参照することにより, F値で約92という高精度の検出器を実現できることを示す.