抄録
検索でヒットするサイトには,ユーザが意図する内容がないもの,情報量が多く,記載箇所が分からないものが多々あり,それを探し出すことは難しい.また,web文章では段落があいまいなものが多く,段落をユーザに提示する際の範囲にできない.本研究では,検索語同士の関連性の高い部分をユーザの意図する範囲と仮定し,読みやすい段落の目安100~150文字の範囲の数文を1単位とし,検索語同士の位置関係と,共通して関連性の高い単語を利用して評価を行いユーザの要求コンテンツを同定する.本手法で,ユーザの意図する内容が同定できるか,又,意図する内容がある文章とない文章の違いを調査する.