人工知能学会全国大会論文集
Online ISSN : 2758-7347
第34回 (2020)
セッションID: 4Rin1-53
会議情報

特徴語抽出の精度改善に向けた反復度と条件付き確率の比較
*菊地 真人山内 達登BUI Tuan Thanh梅村 恭司
著者情報
会議録・要旨集 フリー

詳細
抄録

反復度は語の重要度を測る統計量であり,文書を特徴付ける語が同一文書内で2回以上出現する傾向にあることを仮定している.仮に,いくつかの特徴語やその定義といった教師情報が事前に与えられるならば,より効果的な他の統計量を用いることもできる.しかしながら,そのような情報は利用できないことも多い.もし,反復度が教師情報を利用する統計量と同様の語を抽出できる傾向にあれば,それは教師情報を用いない反復度の有用性を示す根拠となるだろう.その有用性を示すために本稿では,特徴語抽出の実験において反復度と教師情報を利用する条件付き確率を比較し,結果として二つの統計量が同様の語を抽出できる傾向にあることを示す.

著者関連情報
© 2020 一般社団法人 人工知能学会
前の記事 次の記事
feedback
Top