多段自然言語処理におけるNLP, シソーラス, オントロジー辞書データ統合の提案

米持 幸寿; 大場 みち子

doi:10.11517/jsaisigtwo.2019.SWO-047_01

抄録

自然言語解析(NLP)，シソーラス，オントロジーを組み合わせて利用するシステムでは知識システムを処理において多くの問題を抱えている．テキストマイニング，対話システム，文書分類などが例としてあげられる．これらのアプリケーション処理では分析フローとして複数のテクノロジーを多段処理する．そのとき，ある語はオントロジーに見つかるがNLPにはなく，処理エラーの原因となる．本研究の目的は多段自然言語処理のこのエラー率を低減することである. 我々の調査では，BTSJ話し言葉コーパスを使った実験においてNLPが抽出できた名詞がWordNetでは60%，DBPediaでは70%が見つからない．また，NLPが抽出できない複合語がWordNetでは260語，DBPediaでは1,300語が見つかる．このような差異を減少させることが言語処理精度を向上させるために重要である．本論文では各処理に紐づけられた辞書データを統合するフレームワークを構築することを提案し，効果とその実現性を示す．

著者関連情報

お気に入り & アラート

閲覧履歴

発行機関からのお知らせ

第二種研究会の全記事は認証なしでアクセス可能です．また，各記事の著作権は原則として著者に帰属します．

責任著者(Corresponding author)

会議情報

J-STAGEへの登録はこちら（無料）