本稿では, 語義の尤度パラメータの標本空間を, シソーラスに沿って動的に拡張することにより, 動詞の多義性を解消する手法を提案する.提案手法では, 尤度1位の語義と2位の語義とを比較し, 尤度差が統計的に有意ならば, 1位の語義を選ぶ.有意でなければ, シソーラスに沿って標本空間を一段拡張し, 多義性解消を試みる.もし, 最大の標本空間でも尤度差が有意でなければ, 語義は判定しない.本稿の実験では, EDR日本語コーパスから頻度500以上の動詞74語を抽出し, 延べで約89,000の動詞について多義性を解消した.このとき, 最頻の語義を常に選ぶ場合の適合率は0.65, 判定率は1.00であった.ただし, 判定率とは, 多義性の解消を試みたなかで, 実際に語義が判定された割合である.クラスベースの手法と提案手法とを比較すると, 分類語彙表を利用した場合には, 適合率は共に0.71であったが, 判定率は, クラスベースの手法が0.68, 提案手法が0.73であった.EDR概念体系を利用した場合には, 適合率は共に0.70であったが, 判定率は, クラスベースの手法が0.76, 提案手法が0.87であった.両者の判定率を比べると, 提案手法の方が統計的に有意に高く, その有効性が示された.
抄録全体を表示