自然言語処理
Online ISSN : 2185-8314
Print ISSN : 1340-7619
ISSN-L : 1340-7619
汎化用例とシソーラスを用いた派生語の仮名漢字変換の特性
市丸 夏樹中村 貞吾日高 達
著者情報
ジャーナル フリー

2005 年 12 巻 2 号 p. 189-207

詳細
抄録
本稿では, シソーラスと汎化用例を組み込んだPCFGを用いる手法を「名詞一接尾語」型の派生語の仮名漢字変換に適用することの有効性を実験によって明らかにする.一般的な自然言語の処理の流れでは, 形態素解析, 構文解析の順に処理を行うのが通例となっている.しかし派生語は, 派生語基と接尾語という形態素としての内部構造を持ちながら, 1つの語彙としても機能するため, 形態素解析の段階のうちからシソーラスを用いた意味的な処理を適用しておく必要がある.そこで本研究では, フルサイズのシソーラスを使用し, 様々な階層まで汎化した大量の用例と, 品詞レベルの連接規則, 単語レベルの連接規則を組み合わせたPCFGを構築する.その際, 用例の分布密度が高い意味領域にある規則が優先されるように汎化用例の頻度に重み付けを施し, 様々な学習条件下における特性変化の調査結果を用いて, 学習サンプル数に応じた最適な学習条件を選択する.これまでの研究では一般に, 構文解析時の曖昧性の絞り込みにシソーラスを用いた場合にはあまり良い正解率が得られないと言われてきた.しかしそれは学習サンプル数の不足や汎化の過不足によるものであって, 十分な量の用例を与えて最適な汎化を行った場合には, やはり高い正解率を得ることが可能である.我々の実験ではその結果, 派生語変換の1位解で約95%という従来考えられていたよりも高い再現率を得ることができた.
著者関連情報
© 言語処理学会
前の記事 次の記事
feedback
Top