計量国語学
Online ISSN : 2433-0302
Print ISSN : 0453-4611
最新号
選択された号の論文の5件中1~5を表示しています
論文A
  • 小野 洋平, 吉野 諒三, 林 文, ホイットマン ジョン
    原稿種別: 論文A
    2017 年 31 巻 3 号 p. 189-204
    発行日: 2017/12/20
    公開日: 2019/01/11
    ジャーナル オープンアクセス
    This paper uses Multiple Correspondence Analysis (MCA) to re-analyze the linguistic data studied in Tsunoda, Ueda, and Itoh (1995a). Tsunoda et al. (1995a) applied cluster analyses to the word order parameters in Tsunoda, Ueda, and Itoh’s (1995b) database and identified as the main component the word order parameter category "prepositional," thus positing a basic dichotomy between prepositional languages versus adpositionless and postpositional languages. We reanalyze the same data using MCA, together with certain clustering techniques, applied to both the languages and the linguistic parameters in Tsunoda et al.’s (1995b) database simultaneously. This approach confirms the significance of word order parameters involving adposition but suggests a reconsideration of Tsunoda et al.’s (1995a) classification. We find a dichotomy between a cluster of "head-initial" (prepositional, verb-object, and noun-genitive) parameter categories versus a cluster of “head-final” (postpositional, object-verb, and genitive-noun) parameter categories similar to those often grouped together by linguists on the basis of informal cross-linguistic observations. We also find that Noun Phrase internal word order parameters, excepting parameter governing the order of noun and genitive, cluster separately from the others.
  • 森 秀明
    原稿種別: 論文A
    2017 年 31 巻 3 号 p. 205-221
    発行日: 2017/12/20
    公開日: 2019/01/11
    ジャーナル オープンアクセス
    異なったコーパス間である単語に使用率の違いが見つかった場合,単語の頻度を使用してカイ二乗検定を行うことが一般的である.しかし単語を観察単位としたこの方法には統計的検定の前提となるランダム性の仮定を満たしていないという批判がある.そもそもある文書でどのような単語をどれぐらい使用するかは執筆者の判断に委ねられている.従ってコーパスで単語の使用率を比較するなら,執筆者の判断が反映されている文書を観察単位とするのが妥当だと思われる.そこで本稿では文書を観察単位として使用率を比較する分析法の有効性を検討した.使用率の相違は,文書度数分布の相違で説明ができる.また文書度数を使用してカイ二乗検定を行えば,その効果量によって互いの分布の差を有効に評価できる.このため使用率の比較を行うなら,単語ではなく文書を観察単位とするべきだと考えられる.
書評
解説
feedback
Top