計量国語学
Online ISSN : 2433-0302
Print ISSN : 0453-4611
31 巻 , 6 号
選択された号の論文の6件中1~6を表示しています
2018年度特集:多変量解析を用いた言語研究
巻頭言
招待論文A
  • 松田 謙次郎
    2018 年 31 巻 6 号 p. 402-416
    発行日: 2018/09/20
    公開日: 2019/09/20
    ジャーナル オープンアクセス
    変異理論では,分析に用いられる主たる多変量解析手法をめぐって,Johnson(2009)を契機とした科学革命が発生した.30 年近くにわたって続いたVARBRULプログラムによるロジスティックモデルに基づく分析が,一般化線形混合モデル(GLMM)に基づく分析に置き換えられたのであった.本論文ではその歴史的・理論的背景を解説するとともに,GLMMによる分析例としてMatsuda(1993)の東京語可能形のデータを再分析した.話者と動詞語幹という2 つのランダム効果を取り入れた再分析では,言語内的要因はほぼそのまま有意な説明変数として認められた一方,社会的変数は(標準化)話者年齢のみとなった.また語彙的例外性も明らかとなり,過分散や大きな個体差を示すことが多い言語変異データに対するGLMMの有効性を主張した.
招待論文B
  • 探索的多変量解析の実施と分析結果に対するスコアリングによる検討
    財津 亘, 金 明哲
    2018 年 31 巻 6 号 p. 417-425
    発行日: 2018/09/20
    公開日: 2019/09/20
    ジャーナル オープンアクセス
    100名のブログを対象に,句点前の語(文末語)の使用率に基づく,ブログ筆者の識別を試みた.1名の疑問テキスト(筆者不明を想定),1名の対照テキスト(筆者が既知を想定),全く別人の4名の無関係テキスト内の文末語の使用率に着目して,①主成分分析,②多次元尺度法,③対応分析,④階層的クラスター分析を実施し,それらの分析結果に対して得点を付与し,得点を合算することで分析結果を統合した.実験条件として,疑問・対照テキストの筆者が同一人である筆者組合せ条件「同一人」と両テキストの筆者が異なる筆者組合せ条件「別人」を設定し,上記同様の分析を両条件(各100名)で行い,その200名の得点分布を条件間で比較検討した.その結果によると,文末語の使用率のみで,筆者を識別することが可能な上に,非自立語の使用率や品詞のbigramに次いで,筆者の識別力を有していることが示唆された.
特集論文B
  • Elastic Netを使用したモデル構築と評価
    岩崎 拓也
    原稿種別: 特集・論文B
    2018 年 31 巻 6 号 p. 426-442
    発行日: 2018/09/20
    公開日: 2019/09/20
    ジャーナル オープンアクセス
    正書法が一般に浸透していない日本語の文において,読点を打つ・打たないということは恣意性の高い選択である.本研究では,接続詞の直後に読点が打たれる要因を探ることで,日本語の文における読点使用の理由の一端を明らかにすることを試みた.分析データには,BCCWJ のコアデータを使用し,モデル構築にはElastic Netを用いた正則化付きの一般化線形モデルを作成した.この手法をとることで,過学習を防ぐことと,従来では扱うことができなかった情報量の多い変数を取り扱うことができる.モデル評価には,10分割サンプルによる交差検証を実施した.今回構築したモデルを用いて元データの再分類を行った結果,再現率は78.99%であった.また,係数を確認したところ,語彙素「で」,接続詞が文頭にあるとき,語彙素「が」,レジスター「白書」,語彙素「然しながら(しかしながら)」といった指標が接続詞の直後に読点が打たれる強い指標であった.
2017年度特集 文法と計量研究
  • 玉岡 賀津雄, 張 婧禕, 牧岡 省吾
    原稿種別: 2017年度特集・論文B
    2018 年 31 巻 6 号 p. 443-460
    発行日: 2018/09/20
    公開日: 2019/09/20
    ジャーナル オープンアクセス
    日本語は「なる」言語である(池上1981, 2006; 西光2010a, 2010b; 寺村1976など)と言われており,他動詞よりも自動詞がよく使われる傾向が予測される.そこで,自他対応動詞36 対を選び,18 年分(1998-2015)の毎日新聞のコーパスを使って,自動詞と他動詞の使用頻度を比較した.t検定の結果,未然形,連用形,終止形,仮定形,命令形および全活用の総使用頻度のすべてにおいて,自動詞と他動詞の使用頻度に有意な違いはなかった.さらに,使用頻度を自然対数のlogee(x + 0.5)に変換してから同じt 検定で検討した.その結果,命令形以外は36対の自他対応動詞の使用頻度に有意な違いはなかった.命令形については,逆に他動詞のほうがよく使用されていた.また,これらの自他対応動詞の頻度の相関係数は非常に高く(N=36, r=.70, p<.001),自他動詞の対の使用頻度の関連性が示された.本研究は,使用頻度の高い自他対応動詞36 対の使用頻度を比較した結果,自動詞と他動詞の使用傾向に違いがなく,類似した使用傾向であることを示した.
解説
  • 中東 靖恵
    原稿種別: 解説
    2018 年 31 巻 6 号 p. 461-476
    発行日: 2018/09/20
    公開日: 2019/09/20
    ジャーナル オープンアクセス
    本稿では,社会言語学研究が発展する中で,言語研究が直面してきた多人数質問調査法における調査対象者の選定方法をめぐり,有意サンプリングの問題点と有効性について,主にランダムサンプリングと比較しながら述べた.言語研究における多人数調査は有意サンプリングによるものが最も多く,有意サンプルの調査は母集団の代表性に問題があるとされる一方,方言研究などそもそもランダムサンプリングが適用できない場合もあり,有意サンプリングによる多人数調査は事例研究として意義あるものと考える.また,近年の社会情勢の変化や法改正に伴い,個人情報保護の問題,外国人住民の増加,エスニシティ,ジェンダーとの関わりなど,今後の言語調査において検討すべき課題についても触れた.
feedback
Top