抄録
言語を統計的に捉えることで, 人間ではとらえきれない曖昧性や例外, 文脈的依存性を数学的に適切に扱うことが可能になる. その中でも, 単語や文字の頻度分布は, 言語の持つ普遍性や, 地域や時代, 著者等による差異を理解することに役立つだろう. 本研究では, word2vecを用いて言語の意味の持つ特徴を統計モデルとして捉えることができるよう, 意味の頻度分布を作成した. また, 作成した意味の頻度分布に対して, 統計モデルのひとつである一般化ベータ関数に当てはめ, どのような特徴が見られるかを調査, 考察した.