主催: 社団法人 人工知能学会
会議名: 第21回全国大会(2007)
回次: 21
開催地: 宮崎県宮崎市 ワールドコンベンションセンターサミット
開催日: 2007/06/20 - 2007/06/22
本稿は大量にあるWeb ページから有用な情報を抽出するWeb Wrapper(以下ラッパ) において実用的な方法を提案する.従来のラッパの研究では抽出器が単一のラッパで構成される事を前提としていた.しかしながら,単一のラッパでは抽出器の表現力が乏しく,あるページ内における小さなレイアウトの変化に適応できないため,ラッパの生成に失敗する事があった.本研究ではラッパを複数のラッパで構成するために特殊ラッパと呼ぶラッパを定義し,ラッパを複数の特殊ラッパで表現することで,今まで正確に抽出する事が困難だったページに対しても抽出可能である事を確認した.