自然言語処理
Online ISSN : 2185-8314
Print ISSN : 1340-7619
ISSN-L : 1340-7619
一般論文
複合化された固有表現認識のための教師なし並列構造解析
澤田 悠冶寺西 裕紀松本 裕治渡辺 太郎
著者情報
ジャーナル フリー

2021 年 28 巻 4 号 p. 1089-1115

詳細
抄録

固有表現認識は,科学技術論文などのテキストから分野特有の用語を機械的に抽出するタスクである.固有表現認識の従来研究は連続した範囲から成る固有表現のみを解析対象としているが,並列する固有表現の一部が省略された複合的表現が含まれており,これらの固有表現に対して個々の固有表現を抽出することが困難である.本研究では,近年の自然言語処理タスクで広く使用されている学習済み言語モデルを用いて,並列構造の教師データを用いずに並列する句の範囲を同定し,複合化された固有表現を正規化する手法を提案する.GENIA Treebank と GENIA term annotation を用いた評価実験では,教師情報を使用した先行研究と近い解析性能を示し,提案手法によって固有表現認識の精度が向上することを確認した.

著者関連情報
© 2021 一般社団法人 言語処理学会
前の記事 次の記事
feedback
Top