日本語語義曖昧性解消のための訓練データの自動拡張

藤田 早苗; Kevin Duh; 藤野 昭典; 平 博順; 進藤 裕之

doi:10.5715/jnlp.18.273

抄録

本稿では，訓練データの自動拡張による語義曖昧性解消の精度向上方法について述べる．評価対象として，SemEval-2010 日本語語義曖昧性解消タスクを利用した．本稿では，まず，配布された訓練データのみを利用して学習した場合の結果を紹介する．更に，辞書の例文，配布データ以外のセンスバンク，ラベルなしコーパスなど，さまざまなコーパスを利用して，訓練データの自動拡張を試みた結果を紹介する．本稿では，訓練データの自動獲得により 79.5% の精度を得ることができた．更に，対象語の難易度に基づき，追加する訓練データの上限を制御したところ，最高 80.0% の精度を得ることができた．

著者関連情報

Licensed under CC BY 4.0
https://creativecommons.org/licenses/by/4.0/

お気に入り & アラート

お気に入りに追加
追加情報アラート
被引用アラート
認証解除アラート

閲覧履歴

Analysis of In-Plane Problems for an Isotropic Elastic Medium with Many Circular Elastic Inclusions
走査電子顕微鏡の研究開発への応用―解析事例，こんなことに使われる―
Eremothecium coryli によるダイズ子実汚斑病（新称）
ヒトにおける性と繁殖
Regional probabilistic climate projection for Japan with a regression model using multi-model ensemble experiments

責任著者(Corresponding author)

J-STAGEへの登録はこちら（無料）