自然言語処理
Online ISSN : 2185-8314
Print ISSN : 1340-7619
ISSN-L : 1340-7619
論文
商品の属性値抽出タスクにおけるエラー分析
新里 圭司関根 聡村上 浩司
著者情報
ジャーナル フリー

2016 年 23 巻 1 号 p. 37-58

詳細
抄録

本稿では商品の属性値抽出タスクにおけるエラー分析のひとつの事例研究について報告する.具体的には,属性値辞書を用いた単純な辞書マッチに基づく属性値抽出システムを構築し,人手により属性値がアノテーションされたコーパスに対してシステムを適用することで明らかとなる False-positive, False-negative 事例の分析を行った.属性値辞書は商品説明文に含まれる表や箇条書きなどの半構造化データを解析することで得られる自動構築したものを用いた.エラー分析は実際のオンラインショッピングサイトで用いられている 5 つの商品カテゴリから抽出した 100 商品ページに対して行った.そして分析を通してボトムアップ的に各事例の分類を行ってエラーのカテゴリ化を試みた.本稿ではエラーカテゴリおよびその実例を示すだけでなく,誤り事例を無くすために必要な処理・データについても検討する.

著者関連情報
© 2016 一般社団法人 言語処理学会
前の記事 次の記事
feedback
Top