計量国語学
Online ISSN : 2433-0302
Print ISSN : 0453-4611
特集論文B
読点が接続詞の直後に打たれる要因
Elastic Netを使用したモデル構築と評価
岩崎 拓也
著者情報
ジャーナル オープンアクセス

2018 年 31 巻 6 号 p. 426-442

詳細
抄録

正書法が一般に浸透していない日本語の文において,読点を打つ・打たないということは恣意性の高い選択である.本研究では,接続詞の直後に読点が打たれる要因を探ることで,日本語の文における読点使用の理由の一端を明らかにすることを試みた.分析データには,BCCWJ のコアデータを使用し,モデル構築にはElastic Netを用いた正則化付きの一般化線形モデルを作成した.この手法をとることで,過学習を防ぐことと,従来では扱うことができなかった情報量の多い変数を取り扱うことができる.モデル評価には,10分割サンプルによる交差検証を実施した.今回構築したモデルを用いて元データの再分類を行った結果,再現率は78.99%であった.また,係数を確認したところ,語彙素「で」,接続詞が文頭にあるとき,語彙素「が」,レジスター「白書」,語彙素「然しながら(しかしながら)」といった指標が接続詞の直後に読点が打たれる強い指標であった.

著者関連情報
© 計量国語学会

この記事はクリエイティブ・コモンズ [表示 - 非営利 - 改変禁止 4.0 国際]ライセンスの下に提供されています。
https://creativecommons.org/licenses/by-nc-nd/4.0/deed.ja
前の記事 次の記事
feedback
Top