人工知能学会全国大会論文集
Online ISSN : 2758-7347
第28回 (2014)
セッションID: 3M4-3
会議情報

様々なデータ圧縮を用いた多言語に対応するtweetsの話題分類法の精度比較
*王 駿キ佐藤 栄一延原 肇
著者情報
会議録・要旨集 フリー

詳細
抄録

本稿では、データ圧縮技術をテキスト分類に使用することによりテキストの言語に依存しない話題分類を実現し、短文投稿サイトTwitterに投稿されている複数の言語のTweetの分類を行う。また、圧縮の代わりにTweet文字列のエントロピーを用いた場合についても評価し、それぞれの手法の分類精度の比較を行った。

著者関連情報
© 2014 一般社団法人 人工知能学会
前の記事 次の記事
feedback
Top