人工知能学会全国大会論文集
Online ISSN : 2758-7347
第33回 (2019)
セッションID: 1N4-J-9-03
会議情報

文書からの化合物名抽出のためのサブワード有効性調査
*浦澤 合関根 裕人乾 孝司岩倉 友哉
著者情報
キーワード: 化合物抽出, サブワード
会議録・要旨集 フリー

詳細
抄録

本論文は化学化合物抽出におけるサブワード系列の有効性を調査する.5種類のサブワード分割方法(SYMBOL,SP,BPE,BPE-DICT,BPE-PMI)を用いて調査を行った.この内,BPE-DICTとBPE-PMIは今回新たに提案する手法であり,BPE-DICTとは辞書制約付きのBPE,BPE-PMIとは通常のBPEが語の出現頻度を用いる箇所をPointwise Mutual Information(PMI)に置き換えたBPEである.実験結果よりサブワード系列が抽出性能を向上させることを示した.本論文で行った全ての実験結果ではBPE-DICTのF値86.74が最も良い結果となった.

著者関連情報
© 2019 一般社団法人 人工知能学会
前の記事 次の記事
feedback
Top