抄録
本論文では, 文字連鎖を用いた複合語同音異義語誤りの検出手法とその評価について述べる.ワードプロセッサによって作成された日本語文書には, 変換誤りに起因する同音異義語誤りが生じやすい.同音異義語誤りは, 同じ読みの単語を誤った単語へと変換してしまう誤りである.このため, 推敲支援システムにおいて同音異義語誤りを検出する機能を実現することは重要な課題の1つとなっている.我々は, 意味的制約に基づく複合語同音異義語誤りの検出/訂正支援手法を提案した.しかし, この手法においてもいくつかの短所が存在する.本論文では, これらの短所を補うための手法として, 文字連鎖を誤り検出知識として用いた複合語同音異義語誤りの検出手法について述べる.文字連鎖は, 既存の文書を解析することなしに容易に収集することができる.また, 本手法は文字連鎖のみを用いているので, 複合語同音異義語誤りに限らず, 文字削除誤りなどの別のタイプの誤りに適用することも可能である.さらに本論文では, 本手法の有効性を検証するために行った評価実験の結果についても述べ, 意味的制約を用いた複合語同音異義語誤り検出/訂正支援手法との比較についても述べる.