主催: 一般社団法人 人工知能学会
会議名: 2022年度人工知能学会全国大会(第36回)
回次: 36
開催地: 京都国際会館+オンライン
開催日: 2022/06/14 - 2022/06/17
我々は、語のなじみ深さを示す単語親密度を調査し、約163,000語からなる令和版単語親密度データベースを構築した。単語親密度にもとづいて調査語彙を選べば、少数の語を知っているかどうかを回答してもらうだけで、知っている語彙数の概算を推定することができる。 そこで我々は、令和版単語親密度に基づく語彙数推定テストを作成し、2020年6月4日からWebで公開している。公開から2年近くがたち、累計利用者は7万人を超えている。 本稿では、この語彙数推定テスト用の語の選択方法を紹介し、語彙数推定の方法を提案する。さらに回答ログを用いた語彙数推定結果の分析を行う。 特に、年代による語彙数の変化や公開している3つのテストによる違いを示す。