自然言語処理
Online ISSN : 2185-8314
Print ISSN : 1340-7619
論文
文書量に不変な定数―Yule の K, Golcher の VM
木村 大翼田中 久美子
著者情報
ジャーナル フリー

2011 年 18 巻 2 号 p. 119-137

詳細
抄録

本稿では,文書量に不変な定数を考える.このような定数には,言語や文書の複雑さや冗長性を定量化して捉える計算言語学上の意義がある.これらの指標は既存研究でさまざまなものが提案されてきたが,ほとんどの場合英語を中心とする小規模な文書を対象としてきた.本研究では英語以外のさまざまな言語や,大規模な文書も対象として扱い,主に先行研究において値が文長に依らないとされる 3 つの指標 K, Z, VM と本研究で新たに試みた指標である Hr の 5 つの指標に対し,値が一定となるかどうかの実験を行った.結果,値が言語の種類や文長に依らずに一定となる指標は KVM の 2 つの指標であった.なおかつこの 2 つの指標の値には自然言語とプログラミング言語の間で有意な差が見られ,言語の複雑さや冗長性をある観点で表した指標となっていると考えることができる.

著者関連情報
© 2011 言語処理学会
前の記事 次の記事
feedback
Top