人工知能学会全国大会論文集
Online ISSN : 2758-7347
第22回 (2008)
セッションID: 1C1-4
会議情報

Webページにおけるレイアウト情報を考慮したDOMの拡張
*浅見 昌平伊藤 太樹大囿 忠親新谷 虎松
著者情報
会議録・要旨集 フリー

詳細
抄録
DOMはWebページを構成するHTML要素を操作するAPIである.DOMの問題点として,Webページにおけるレイアウト情報を参照できないことが挙げられる.例えば,TABLE要素は表を構成する以外に,ページのレイアウトを整形する目的で使われる.この場合,DOMにアクセスするアプリケーションは,TABLE要素がどちらの用途で使われているか判断できない.本研究では,DOM木を拡張し,Webページにおけるレイアウト情報が参照可能な構造へ変換する.拡張したDOM木を用いることで,HTML文書から抽出が困難な要素同士の位置関係,および要素の分類を参照することができる.
著者関連情報
© 2008 社団法人 人工知能学会
前の記事 次の記事
feedback
Top