クラスタリングを利用した語義曖昧性解消の誤り原因のタイプ分け

新納 浩幸; 村田 真樹; 白井 清昭; 福本 文代; 藤田 早苗; 佐々木 稔; 古宮 嘉那子; 乾 孝司

doi:10.5715/jnlp.22.319

論文

クラスタリングを利用した語義曖昧性解消の誤り原因のタイプ分け

新納浩幸, 村田真樹, 白井清昭, 福本文代, 藤田早苗, 佐々木稔, 古宮嘉那子, 乾孝司

著者情報

キーワード: 語義曖昧性解消, 誤り分析, クラスタリング

ジャーナルフリー

2015 年 22 巻 5 号 p. 319-362

DOI https://doi.org/10.5715/jnlp.22.319

詳細

抄録

語義曖昧性解消の誤り分析を行う場合，まずどのような原因からその誤りが生じているかを調べ，誤りの原因を分類しておくことが一般的である．この分類のために，分析対象データに対して分析者 7 人が独自に設定した誤り原因のタイプを付与したが，各自の分析結果はかなり異なり，それらを議論によって統合することは負荷の高い作業であった．そこでクラスタリングを利用してある程度機械的にそれらを統合することを試み，最終的に 9 種類の誤り原因として統合した．この 9 種類の中の主要な 3 つの誤り原因により，語義曖昧性解消の誤りの 9 割が生じていることが判明した．またタイプ分類間の類似度を定義することで，統合した誤り原因のタイプ分類が，各自の分析結果を代表していることを示した．また統合した誤り原因のタイプ分類と各自の誤り原因のタイプ分類を比較し，ここで得られた誤り原因のタイプ分類が標準的であることも示した．

責任著者(Corresponding author)

J-STAGEへの登録はこちら（無料）