抄録
心理言語学は、人間の言語理解・産出・習得に関わる心的処理はどのようなものであるか、という課題に答えることを目的とする研究領域である。この研究課題に答えるために、様々なレベル(音韻・形態・統語・意味など)で操作された言語刺激を素材として実験が行われているが、その中で広く用いられている手法の1つが、反応時間を計測する行動実験である 。多くの場合、その前提は、ある条件における反応時間が、別の条件における反応時間よりも長かった場合、前者の方でより複雑な言語処理が行われている、ということである。従来、このような心理言語実験は、第一言語(L1)話者を対象として幅広く行われていて、人間の母語使用・習得に関して、多くの知見が得られている。しかし近年、言語に関わる心理プロセスを明らかにしようとする動きは、第二言語(L2)話者を対象とするものにまで広がってきていて、L2話者を対象にした心理言語実験も多く行われている。これは、L1のように流暢に使いこなせるわけではないが、何らかの言語処理システムを使って言語を使用・習得するという点についてはL2も同様であり、不完全である分、熟達度に応じた言語発達(あるいはそれに関与する人の認知システム)について、より詳細なデータを与えてくれるのでは、という考え方に基づいている(門田, 2010)。
このように、反応時間を計測する心理言語実験は、L1・L2話者を対象として幅広く行われている。実験の実施方法、データ分析法については、共通の理解が得られている部分が多いが、研究者によって異なる、という部分も少なからず見受けられる。この内の1つが、反応時間を分析する際の外れ値(outlier)の取り扱いについてである。外れ値とは、実験機器の操作ミス、集中力の低下、外部からのノイズなどによって生じる、極端に短い、あるいは長い反応時間のことである。外れ値をそのまま放置したデータは、分析・解釈に大きな影響を与える恐れがあり、タイプ1・タイプ2のエラーを起こす原因となる可能性がある。そのため、研究者は何らかの方法で外れ値の影響を低減する処置を行うが、その方法は一貫しておらず、どのような時にどの方法を使うのが良いか、ということを提案するガイドラインも少ない。
本稿では、筆者が実施した、日本人英語学習者が英文を読む際の統語解析を調べる実験を例にして、外れ値の取り扱いについて考察する。データ中に含まれる外れ値(と思われる値)はどのようなものかを提示して、実際に外れ値の影響を低減する方法をいくつか紹介する。また、外れ値を含んだままのデータと、外れ値の影響を小さくするよう処理されたデータで、どのように記述・推測統計の結果が異なるかを検討する。