人工知能学会全国大会論文集
Online ISSN : 2758-7347
第32回 (2018)
セッションID: 4Pin1-18
会議情報

多段Doc2Vecによるエンティティリンキングの応用
*津々見 誠村上 浩司梅田 卓志
著者情報
会議録・要旨集 フリー

詳細
抄録

データの構造化は自然言語処理における重要なテーマの1つである.我々はeコマースにおけるデータ構造化の一環として,楽天市場の商品のメーカー名と,知識ベース上の企業との自動マッピングのタスクに取り組んだ.テキスト中で何らかの実体を指示する用語を知識ベースに対応付けるエンティティリンキングにおいて,語の多義性やエンティティの曖昧性,リンクの存在の不確定性等,解決すべき課題は多い.我々は役割の異なるDoc2Vecモデルを多段に重ねて複数の観点からリンキングの正当性を検証する手法を提案する.評価実験において本手法はテキストマッチングによる手法を31.0ポイント上回る83.5%のマッピング精度を達成した.本手法は用語の多義性をはじめとする課題の解決に対して有効である他,辞書や教師データの作成等人手を要する工程を必要とせず,コスト面での優位性が高いことを示した.

著者関連情報
© 2018 一般社団法人 人工知能学会
前の記事 次の記事
feedback
Top