2014 年 2014 巻 24 号 p. 222-233
本研究の目的は,日本語,中国語の大規模データに言語統計解析を用いて確率的言語知識構造を構築し,個々の言語の表面的な違いを超えて両言語の背景にある文化や社会システムを比較考察することである.本研究では,従来用いられている潜在意味分析(Latent Semantic Analysis)等の問題点を解消した,より厳密な確率的方法として,Kameya & Sato[6] のアルゴリズムを用いる.具体的には,同手法を用いて推定された両言語における多数の潜在クラスから,特に分析結果の解釈に基づき,中国語と日本語で同じネーミングになったクラスを選んで,比較考察した.本研究の方法を用いて,日本語,中国語に限らず,より多くの他言語,たとえば英語の大規模データベースを用いて,同様の確率的言語知識構造を構成し,多角的な比較研究を進めていくことも今後の重要な課題の一つである.