システム制御情報学会 研究発表講演会講演論文集
第51回システム制御情報学会研究発表講演会
セッションID: 4F1-4
会議情報

Webからの属性名抽出に関する基礎検討
*中根 史敬大坪 正典土方 嘉徳西田 正吾
著者情報
会議録・要旨集 フリー

詳細
抄録
Web上には大量の半構造化文書がある. 検索エンジンでは,それらから検索語を含むページを得ることができる. しかし,『画素数が700万のデジカメ』というような,あるオブジェクトに関する情報を直接得るためには,属性名(この場合,「画素数」)と属性値(この場合,「700万」)を自動で抽出する手法が必要となる. これまで,特定の属性名に対する属性値を抽出する情報抽出の研究は多く行われてきた. 本研究では,ブートストラッピングによって,スキーマ(属性名の組)を抽出する手法を提案する.
著者関連情報
© 2007 システム制御情報学会
前の記事 次の記事
feedback
Top