自然言語処理
Online ISSN : 2185-8314
Print ISSN : 1340-7619
ISSN-L : 1340-7619
「決定木」分析によるコーパス研究の可能性: 副詞と共起する接続助詞「から」「ので」「のに」の文中・文末表現を例に
玉岡 賀津雄
著者情報
ジャーナル フリー

2006 年 13 巻 2 号 p. 169-179

詳細
抄録

SPSS社のAnswerTree3.0Jに搭載されたCHAIDで決定木を描く統計手法が, コーパスから得られる2つ以上の変数からなる共起頻度を分析するのに有効であるかどうかを検討した・本研究では, 3種類の接続助詞「から」「ので」「のに」が, 7種類の副詞「何しろ」「何せ」「せっかく」「現に」「どうせ」「実際」「本当に」と共起する場合に, 文中と文末の表現でどちらが使われるかを, 新潮文庫100冊を使って解析した.決定木 (図1を参照) は, 3種類の接続助詞と7種類の副詞の共起頻度によって, 接続助詞の位置が文中にくるか文末にくるかを予測するという分析結果を描いたものである.決定木から5つの特徴を読み取ることができる.まず第1に, 接続助詞「ので」と「から」が副詞との共起頻度において文中・文末で顕著な違いを示した.「ので」は文末ではほとんどみられず (5回あるいは4.59%), 「から」は頻繁にみられた (220回あるいは31.56%).第2に, 副詞「何しろ」と接続助詞「から」がもっとも典型的な文末表現であることが分かった (この種の組み合わせの合計324回のうち140回あるいは43.21%).第3に, 接続助詞「から」と副詞の「せっかく」の共起は, かなりあるものの, 文末では非常に少ないことも分かった (この種の組み合わせの合計67回のうち6回あるいは8.96%).第4に, 接続助詞「から」と副詞「何せ」「現に」「どうせ」「実際」「本当に」はいずれも, 文中・文末にほぼ同じようなパターンで共起していることも示された.第5に, 接続助詞「のに」は副詞の文中・文末の共起パターン (文中が78。82%, 文末が21.18%) が, 全体の共起頻度 (文中が72.73%, 文末が27.27%) と類似していた.以上のように, AnswerTree3.0Jによる決定木の手法は, 複数の変数からなる共起頻度データを構造的に分析することができ, 今後のコーパス研究において有効な手段の一つとなるであろう.

著者関連情報
© 言語処理学会
前の記事
feedback
Top