自然言語処理
Online ISSN : 2185-8314
Print ISSN : 1340-7619
論文
日本語語義曖昧性解消のための訓練データの自動拡張
藤田 早苗Kevin Duh藤野 昭典平 博順進藤 裕之
著者情報
ジャーナル フリー

2011 年 18 巻 3 号 p. 273-291

詳細
抄録

本稿では,訓練データの自動拡張による語義曖昧性解消の精度向上方法について述べる.評価対象として,SemEval-2010 日本語語義曖昧性解消タスクを利用した.本稿では,まず,配布された訓練データのみを利用して学習した場合の結果を紹介する.更に,辞書の例文,配布データ以外のセンスバンク,ラベルなしコーパスなど,さまざまなコーパスを利用して,訓練データの自動拡張を試みた結果を紹介する.本稿では,訓練データの自動獲得により 79.5% の精度を得ることができた.更に,対象語の難易度に基づき,追加する訓練データの上限を制御したところ,最高 80.0% の精度を得ることができた.

著者関連情報
© 2011 言語処理学会
前の記事 次の記事
feedback
Top