自然言語処理
Online ISSN : 2185-8314
Print ISSN : 1340-7619
ISSN-L : 1340-7619
動詞の長さの分布に基づいた文章の分類と和語及び合成語の比率
金 明哲
著者情報
ジャーナル フリー

1995 年 2 巻 1 号 p. 57-75

詳細
抄録
文章 (テキスト) の執筆者の推定問題などに対して, 文章の内容や成立に関する歴史的事実の考証とは別に, 文章から著者の文体の計量的な特徴を抽出し, その統計分析によって問題解決を試みる研究が多くの人々の注目をあつめつつある. 文章に関するどのような要素に著者の特徴が現れるかについて, 欧米文に関してはいくつかの研究の例があるが, それは言語によって異なるとも考えられるため, 欧米文に関する研究成果が日本文の場合にもあてはまるかについて実証的な研究が必要である. また, 各言語はその言語における著者の特徴を表す独特な要素があることも考えられる. 本論文では, 今まで明らかにされていない, 日本文における動詞の長さの分布に著者の特徴が現れることと, その結果が動詞中の漢語・和語, 合成語・非合成語の使用率の影響ではないことを著者3人の計21の文章を用いて明らかにした. 計量分析の手法としては, 同一著者の文章における動詞の長さの分布問の距離の平均値と, 異なる著者の文章における動詞の長さの分布の距離の平均値との差, および距離マトリックスを用いて主成分分析を行うという方法を用いて数量・視覚的文章の分類を試みた.
著者関連情報
© 言語処理学会
前の記事
feedback
Top