自然言語処理
Online ISSN : 2185-8314
Print ISSN : 1340-7619
ISSN-L : 1340-7619
論文
複数の言語的特徴を用いた日本語述部の同義判定
泉 朋子柴田 知秀齋藤 邦子松尾 義博黒橋 禎夫
著者情報
ジャーナル フリー

2013 年 20 巻 4 号 p. 539-561

詳細
抄録
大量のテキストから有益な情報を抽出するテキストマイニング技術では,ユーザの苦情や要望を表す述部表現の多様性が大きな問題となる.本稿では,同じ出来事を表している述部表現をまとめ上げるため,「メモリを消費している」と「メモリを食っている」の「消費している」と「食っている」のような述部表現を対象に,異なる 2 つの述部が同義か否かを認識する同義判定を行う.述部の言語構造分析をもとに,「辞書定義文」,「用言属性」,「分布類似度」,「機能表現」という複数の言語知識を用い,それらを素性とした識別学習で同義判定を行った.実験の結果,既存手法に比べ,高い精度で述部の同義性を判定することが可能になった.
著者関連情報
© 2013 言語処理学会
前の記事 次の記事
feedback
Top