人工知能学会全国大会論文集
Online ISSN : 2758-7347
第33回 (2019)
セッションID: 4Rin1-23
会議情報

ECサイトにおける商品タイトルからの商品名抽出
*張 培楠
著者情報
会議録・要旨集 フリー

詳細
抄録

本研究ではECサイトにおける商品タイトルからの商品名抽出というタスクを提案し,そのためのコーパスの作成およびそれを使った実験・分析を行った.従来の固有表現抽出タスクとの違いとして,一般的には文法的に意味が通る自然文を実験に使うことが多いが,このタスクで使用するデータは名詞句の集合であることが多いため文法構造をほぼ持たない.また,漢字かなやアルファベット,数字,記号が多用されるため,セグメンテーションが困難である.Term Weighting と系列ラベリング問題のふたつのアプローチで実験し,前者は TF-IDF を,後者は素性設計による手法と End-to-End なニューラルネットワークによる手法で検証した.その結果,ラベル列をF値で評価した場合はニューラルネットワーク手法が F値 23.0 と最も良い性能を発揮したが,高精度を達成したデータセットと比べるとかなりの性能低下が見られる.このことから本タスクは難易度が高いタスクであることが言える.

著者関連情報
© 2019 一般社団法人 人工知能学会
前の記事 次の記事
feedback
Top