自然言語処理
Online ISSN : 2185-8314
Print ISSN : 1340-7619
ISSN-L : 1340-7619
論文
共変量シフトの問題としての語義曖昧性解消の領域適応
新納 浩幸佐々木 稔
著者情報
ジャーナル フリー

2014 年 21 巻 1 号 p. 61-79

詳細
抄録

本稿では語義曖昧性解消 (Word Sense Disambiguation, WSD) の領域適応が共変量シフトの問題と見なせることを示し,共変量シフトの解法である確率密度比を重みにしたパラメータ学習により,WSD の領域適応の解決を図る.共変量シフトの解法では確率密度比の算出が鍵となるが,ここでは Naive Bayes で利用されるモデルを利用した簡易な算出法を試みた.そして素性空間拡張法により拡張されたデータに対して,共変量シフトの解法を行う.この手法を本稿の提案手法とする.BCCWJ コーパスの 3 つ領域 OC (Yahoo! 知恵袋),PB(書籍)及び PN(新聞)を選び,SemEval-2 の日本語 WSD タスクのデータを利用して,多義語 16 種類を対象に,WSD の領域適応の実験を行った.実験の結果,提案手法は Daumé の手法と同等以上の正解率を出した.本稿で用いた簡易な確率密度比の算出法であっても共変量シフトの解法を利用する効果が高いことが示された.より正確な確率密度比の推定法を利用したり,最大エントロピー法の代わりに SVMを利用するなどの工夫で更なる改善が可能である.また教師なし領域適応へも応用可能である.WSD の領域適応に共変量シフトの解法を利用することは有望であると考えられる.

著者関連情報
© 2014 言語処理学会
前の記事
feedback
Top