2019 年 2019 巻 SWO-047 号 p. 01-
自然言語解析(NLP),シソーラス,オントロジーを組み合わせて利用するシステムでは知識システムを処理において多くの問題を抱えている.テキストマイニング,対話システム,文書分類などが例としてあげられる.これらのアプリケーション処理では分析フローとして複数のテクノロジーを多段処理する.そのとき,ある語はオントロジーに見つかるがNLPにはなく,処理エラーの原因となる.本研究の目的は多段自然言語処理のこのエラー率を低減することである. 我々の調査では,BTSJ話し言葉コーパスを使った実験においてNLPが抽出できた名詞がWordNetでは60%,DBPediaでは70%が見つからない.また,NLPが抽出できない複合語がWordNetでは260語,DBPediaでは1,300語が見つかる.このような差異を減少させることが言語処理精度を向上させるために重要である.本論文では各処理に紐づけられた辞書データを統合するフレームワークを構築することを提案し,効果とその実現性を示す.