Webインテリジェンスとインタラクション研究会 予稿集
Online ISSN : 2758-2922
第11回研究会
会議情報

セッション3:言語・テキスト処理
量的不均衡データに対する学習精度改善のための文書かさ増し手法
澤崎 夏希遠藤 聡志當間 愛晃山田 孝治赤嶺 有平
著者情報
会議録・要旨集 フリー

p. 41-46

詳細
抄録

機械学習アルゴリズムが特徴量そのものを学習することで様々な領域での問題解決にブレークスルーが起こっている.テキスト分類の問題領域でも,多くの場合.高い分類精度を達成している.しかし成功例の多くは各正解ラベルのデータ量が均一あるいはそれに近い状態であることが多い.このため.すべての正解ラベルデータを十分量用意するためのコストが機械学習アプローチのボトルネックとなっている.また.ラベル毎のデータ量が不揃いな場合は不均衡データと呼ばれうまく分類できないことが知られている.本研究では,自然言語の不均衡データに対するかさ増し手法を提案する.提案手法を用いた,不均衡データ分類問題の計算実験を行い.分類精度の検証によってその有用性を評価する.

著者関連情報
2017 この論文のすべての権利と著作権は著者に帰属します。
前の記事 次の記事
feedback
Top