2026 年 35 巻 4 号 p. 224-239
本研究は,日本語の書き言葉における基礎的な定式表現の種類や使用割合を明らかにすることを目的とし,『現代日本語書き言葉均衡コーパス』における3つの「出版サブコーパス」を対象に,n-gramモデルを用いて3-gramから7-gramの高頻度語列を分析した.その結果,3レジスターに共通する定式表現には語順が固定化された表現文型と,実質語が複数組み合わさるタイプが多く,特に3-gramと4-gramにおいては大きな割合を占めることがわかった.また,その多くはコロケーションや文法コロケーションに分類された.さらに,2つ以上の実質語からなるコロケーションは,[名詞/助詞/動詞]の組み合わせが目立ち,より詳細な意味を表現する傾向が確認された.最後に,定式表現の割合については,コロケーションのような固定定式表現の割合が高いが,表現文型のような半固定定式表現も少なからずあり,書き言葉における語彙の規則性と柔軟性が共存していることが示唆された.