2016 年 25 巻 3 号 p. 105-115
農産物関連レビューの解析精度向上に資する辞書拡張を効率化するため,消費者が記述した野菜商品レビューに出現する語の特徴を明らかにし,既存ソフトウェアによる網羅的収集や研究者語彙の利用可能性を検討した.本研究では形態素解析辞書に登録された語を一般分野の語とし,未登録語の中に野菜商品レビューに特異的な概念を表すドメイン概念語が含まれると仮定した.用語抽出モジュールTermExtractの重要度スコアに基づきドメイン概念語を選定したところ,その60%が品種やブランドの名称等を含む商品の名称であった.品種やブランドの名称には同表記異義語を認めた.研究者語彙が蓄積する農業研究機関ウェブページでは,ドメイン概念語が表す66%の概念が出現し,出現割合は健康機能性,安全性等の分類項目で高く,商品の名称,特にブランドの名称で有意に低かった.以上から,野菜商品レビューの解析精度向上には高出現する商品の名称を形態素解析辞書へ登録する必要があること,研究者語彙からの効率的収集は健康機能性・安全性等の分類項目語については可能性があるが,品種・ブランドの名称は困難であること,品種・ブランドの名称は同表記異義語を区別する情報登録が必要であることを明らかにした.