主催: Webインテリジェンスとインタラクション研究会
会議名: WI2研究会
回次: 11
開催地: LIFULL本社
開催日: 2017/12/15 - 2017/12/16
p. 41-46
機械学習アルゴリズムが特徴量そのものを学習することで様々な領域での問題解決にブレークスルーが起こっている.テキスト分類の問題領域でも,多くの場合.高い分類精度を達成している.しかし成功例の多くは各正解ラベルのデータ量が均一あるいはそれに近い状態であることが多い.このため.すべての正解ラベルデータを十分量用意するためのコストが機械学習アプローチのボトルネックとなっている.また.ラベル毎のデータ量が不揃いな場合は不均衡データと呼ばれうまく分類できないことが知られている.本研究では,自然言語の不均衡データに対するかさ増し手法を提案する.提案手法を用いた,不均衡データ分類問題の計算実験を行い.分類精度の検証によってその有用性を評価する.