計量国語学
Online ISSN : 2433-0302
Print ISSN : 0453-4611
論文 A
日本語書き言葉における定式表現分析の試み
n-gramモデルを用いて
蘇 振軍
著者情報
ジャーナル オープンアクセス

2026 年 35 巻 4 号 p. 224-239

詳細
抄録

 本研究は,日本語の書き言葉における基礎的な定式表現の種類や使用割合を明らかにすることを目的とし,『現代日本語書き言葉均衡コーパス』における3つの「出版サブコーパス」を対象に,n-gramモデルを用いて3-gramから7-gramの高頻度語列を分析した.その結果,3レジスターに共通する定式表現には語順が固定化された表現文型と,実質語が複数組み合わさるタイプが多く,特に3-gramと4-gramにおいては大きな割合を占めることがわかった.また,その多くはコロケーションや文法コロケーションに分類された.さらに,2つ以上の実質語からなるコロケーションは,[名詞/助詞/動詞]の組み合わせが目立ち,より詳細な意味を表現する傾向が確認された.最後に,定式表現の割合については,コロケーションのような固定定式表現の割合が高いが,表現文型のような半固定定式表現も少なからずあり,書き言葉における語彙の規則性と柔軟性が共存していることが示唆された.

著者関連情報
© 2026 計量国語学会

この記事はクリエイティブ・コモンズ [表示 - 非営利 - 改変禁止 4.0 国際]ライセンスの下に提供されています。
https://creativecommons.org/licenses/by-nc-nd/4.0/deed.ja
前の記事 次の記事
feedback
Top