抄録
本論文では, 情報検索のための表記の揺れに寛容な類似尺度を提案する. 情報検索において, 検索対象となるデータがさまざまな人によって記述されたものであるため, 同じ事柄であっても表記が異なり, 入力した文字列で意図した情報を得ることができない場合がある. 人間ならば, 表記が多少異なっていて (表記の揺れがあって) も柔軟に対応し, 一致していると判断できるが, 計算機はこの柔軟性を備えていない. 表記の揺れに対応することができる尺度として編集距離が知られているが, 実際にこの尺度を単純に類似尺度に変換したものを用いて情報検索を行ってみたが, 性能がでなかった. そこで, 本論文では, この単純な類似尺度を情報検索に適した表記の揺れに寛容な類似尺度に拡張することを試み, その結果, この拡張によって検索性能が向上したことを示す. さらに, 提案する類似尺度を組み込んだ情報検索システムを構築し, 多くの情報検索システムに用いられている一般的な類似尺度と同等以上の検索性能を実現できたことを示す.