抄録
近年, 言い換え表現の自動獲得の研究が重要視されつつある. 本稿では, 複数の辞書を用意して, それらにおける同じ項目の定義文を照合することにより, 言い換え表現の一種である同義表現を抽出することを試みた. また, 同義表現を抽出するための新しい尺度を提案し, その尺度で抽出データをソートした結果の精度は, 一般によく行なわれる頻度だけでソートする方法による結果よりも高いことを確認した. この尺度は, 他の同義表現の抽出の研究にも利用できる有用なものである. 提案手法では, 同義表現のみを正解とするとき, 上位500個で0.748, ランダムに抽出した500個で0.220の抽出精度であった. また, 誤りの多くのものは包含関係や類義関係にある表現であり, それらも正解と判断する場合は, 上位500個で0.954, ランダムに抽出した500個で0.722の抽出精度であった.