人工知能学会第二種研究会資料
Online ISSN : 2436-5556
多段自然言語処理におけるNLP, シソーラス, オントロジー辞書データ統合の提案
米持 幸寿大場 みち子
著者情報
研究報告書・技術報告書 フリー

2019 年 2019 巻 SWO-047 号 p. 01-

詳細
抄録

自然言語解析(NLP),シソーラス,オントロジーを組み合わせて利用するシステムでは知識システムを処理において多くの問題を抱えている.テキストマイニング,対話システム,文書分類などが例としてあげられる.これらのアプリケーション処理では分析フローとして複数のテクノロジーを多段処理する.そのとき,ある語はオントロジーに見つかるがNLPにはなく,処理エラーの原因となる.本研究の目的は多段自然言語処理のこのエラー率を低減することである. 我々の調査では,BTSJ話し言葉コーパスを使った実験においてNLPが抽出できた名詞がWordNetでは60%,DBPediaでは70%が見つからない.また,NLPが抽出できない複合語がWordNetでは260語,DBPediaでは1,300語が見つかる.このような差異を減少させることが言語処理精度を向上させるために重要である.本論文では各処理に紐づけられた辞書データを統合するフレームワークを構築することを提案し,効果とその実現性を示す.

著者関連情報
© 2019 著作者
次の記事
feedback
Top