類似度を用いた形態素解析誤り検出尺度

黒澤 義明; 坂本 裕二; 市村 匠; 相沢 輝昭

doi:10.14864/fss.21.0.33.0

抄録

近年，自然言語処理研究の進展が著しい．中でも，形態素解析器の精度は向上し，90％を超えるようになった．この結果，大量の形態素解析処理出力の中から，人手で解析誤りを発見することが困難になってきている．そこで本研究は，形態素列間の類似度を用い，与えられた文がどの程度正事例や負事例に似ているかを表す尺度を求めることにより，形態素解析誤りを自動的に発見する手法について提案を行う．この類似度計算を行うシステムを構築し，641文（うち，誤り57文）の入力を行う計算機実験を行った．この結果，74％の精度で，形態素分割誤りだけでなく品詞同定誤りを含む形態素解析誤りの検出が可能であった．また，数は5例と少数ではあるが，精度を100%とする検出方法も見出されており，本提案の有効性が確認された．

著者関連情報

お気に入り & アラート

閲覧履歴

責任著者(Corresponding author)

J-STAGEへの登録はこちら（無料）