自然言語処理
Online ISSN : 2185-8314
Print ISSN : 1340-7619
ISSN-L : 1340-7619
論文
トピック情報を用いたブートストラップ法に基づく語彙獲得
貞光 九月齋藤 邦子今村 賢治松尾 義博菊井 玄一郎
著者情報
ジャーナル フリー

2012 年 19 巻 2 号 p. 89-106

詳細
抄録
本論文ではブートストラップ法を用いた語彙獲得を行う際に,トピック情報を用いることでセマンティックドリフトを緩和し,獲得精度を向上できることを示す.獲得対象とする語を含む文書の大域的情報であるトピック情報を,統計的トピックモデルを用いて推定し,識別モデルを用いたブートストラップ法における3つの過程で利用する.1つ目は識別モデルにおける素性として,2つ目は負例生成の選択基準として,3つ目は学習データの多義性解消のために用いる.実験において,提案手法を用いることでセマンティックドリフトを軽減し,語彙の獲得精度が6.7から28.7%向上したことを示す.
著者関連情報
© 2012 言語処理学会
前の記事
feedback
Top