自然言語処理
Online ISSN : 2185-8314
Print ISSN : 1340-7619
ISSN-L : 1340-7619
論文
日本語形態素解析における未知語処理の一手法―既知語から派生した表記と未知オノマトペの処理―
笹野 遼平黒橋 禎夫奥村 学
著者情報
ジャーナル フリー

2014 年 21 巻 6 号 p. 1183-1205

詳細
抄録

本論文では,形態素解析で使用する辞書に含まれる語から派生した表記,および,未知オノマトペを対象とした日本語形態素解析における効率的な未知語処理手法を提案する.提案する手法は既知語からの派生ルールと未知オノマトペ認識のためのパターンを利用し対象とする未知語の処理を行う.Web から収集した 10 万文を対象とした実験の結果,既存の形態素解析システムに提案手法を導入することにより新たに約 4,500 個の未知語を正しく認識できるのに対し,解析が悪化する箇所は 80 箇所程度,速度低下は 6% のみであることを確認した.

著者関連情報
© 2014 言語処理学会
前の記事 次の記事
feedback
Top