自然言語処理
Online ISSN : 2185-8314
Print ISSN : 1340-7619
ISSN-L : 1340-7619
技術資料
小学生の作文コーパスの収集とその応用の可能性
坂本 真樹
著者情報
ジャーナル フリー

2010 年 17 巻 5 号 p. 5_75-5_98

詳細
抄録
現在共有されている日本人の子供の書き言葉コーパスは非常に少ないが,子供の書き言葉コーパスは,日本語の使用実態の年齢別推移の分析や,子供の言葉に特徴的に現れる言語形式の分析,国語教育・日本語教育への活用など日本語研究での利用はもちろんのこと,認知発達,社会学など,さまざまな分野での応用の可能性がある.そこで本研究では,全国 4,950 校の小学校の Web サイトを調査し,公開されている作文について,各テキストが子供の書いたテキストであることや学年などの情報を確認の上,作文データの収集を行った.収集したテキスト総数は 10,006,語数は 1,234,961 である.本研究では,大人よりも子供の言語使用において豊富で多様な使用が観察されると予想されるオノマトペに着目し,その学年別の使用実態の推移について調査した.その結果,オノマトペの出現率は学年が上がるにつれ減少していくことが確認できた.さらに,社会学的応用例として,子供と父母との関係性について調査し,父母とのやりとりとそれに対する子供の反応との関係性が,母親の場合の方が強いことを示し,本コーパスのさまざまな応用の可能性を示した.
著者関連情報
© 2010 言語処理学会
前の記事
feedback
Top