主催: Webインテリジェンスとインタラクション研究会
会議名: WI2研究会
回次: 5
開催地: 株式会社リクルートホールディングス 本社
開催日: 2014/11/22 - 2014/11/23
p. 50-55
ブログやSNSには話し言葉による投稿が多く,オノマトペが多数存在する.それらオノマトペは,日本語に多く存在し,自然言語処理のタスクにおいても無視できない.特に複数の意味を持つオノマトペは,文中で使われている意味を判別する必要があり,機械翻訳などのタスクで問題となる.オノマトペの多義性解消にはオノマトペの係り先動詞が有効であることが確認されているが,ブログやSNSには係り先動詞がない文が存在したり,係り先動詞だけでは判別できない文も存在する.そこで本稿では,一語で擬音語と擬態語の2つの意味を持つオノマトペが文中においてどちらの意味で使われているか自動的に判別する手がかりとして,名詞の有効性を検証した.オノマトペの意味を決定している名詞を自動で文から抽出する手法を構築し,抽出した名詞を使用して,9種類のオノマトペの多義性の解消を行った.オノマトペの意味を決定する名詞の自動抽出手法の精度および,文中でのオノマトペが擬音語か擬態語かの判別精度ともに,8割を大きく超える精度を達成し,オノマトペの多義性解消における名詞の有効性が確認された.