Japanese Journal of Social Psychology
Online ISSN : 2189-1338
Print ISSN : 0916-1503
ISSN-L : 0916-1503
Articles
Experimental verification of the anchoring effect of a punishment reference histogram
Eiichiro WatamuraToshihiro WakebeMasahiko Saeki
Author information
JOURNAL FREE ACCESS FULL-TEXT HTML

2014 Volume 30 Issue 1 Pages 11-20

Details

序論

量刑判断とは、被告人に対して言い渡される具体的刑罰の内容を決める判断であるとされる(城下,2009)。日本の裁判員制度やフランスなどの参審制度の下では、主に重犯罪の裁判において、法の素人が裁判官との評議で量刑判断を行う(裁判員の参加する刑事裁判に関する法律2条1項および6条1項;芦澤,2001)。

量刑判断にはアンカーが影響する(Englich & Mussweiler, 2001; Englich, Mussweiler, & Strack, 2005, 2006)。アンカーとは、ものの値段や出来事の生起確率などの数量判断で基準になる数値のことであり、バイアスとして影響する(アンカリング効果)。代表的な実験では、国連に加盟しているアフリカの国の割合を判断するという課題で、直前に「65%より高いか低いか」と尋ねられた参加者群は45%と回答したのに対し、「10%より高いか低いか」と尋ねられた群は25%と回答した(Tversky & Kahneman, 1974)。この結果は、事前に与えられた数値(65%または10%)がアンカーとして回答に影響したことを示している。

アンカリング効果は現実場面における判断にも見られる(e.g., Carlson, 1990; Galinsky & Mussweiler, 2001; Mussweiler, Strack, & Pfeiffer, 2000; Northcraft & Neale, 1987)。たとえばNorthcraft & Neale(1987)の実験では、不動産の鑑定価格を推測させるという課題で、ヒントとして与えた売り出し価格の情報が参加者の判断に影響することが示された。

刑事裁判における判断も現実場面における判断の1つであり、アンカリング効果が生じうる(Englich & Mussweiler, 2001; Saks & Kidd, 1980)。アンカリング効果は不確実性下の判断で特に生じやすい(Mussweiler & Strack, 2000; Tversky & Kahneman, 1974; Wegener, Petty, Detweiler-Bedell, & Jarvis, 2001)。不確実性とは、判断材料が多くて複雑であったり、判断のしかたが決まっていなかったりするような状況のことである。刑事裁判には多くの証拠があり、証拠どうしが矛盾していたり、信憑性が疑われていたりすることがある。さらに、そうした証拠にどれだけ判断の根拠をおくかといった点に関しても、特に決まりがあるわけではない。それゆえ、刑事裁判の判断にはアンカーが影響しうる。

刑事裁判における判断の中でも、量刑判断はとりわけ不確実である。理由の1つは、多くの事情を考慮しなければならないからである。主なものだけでも、犯罪の結果・犯行の様態・被告人の前科・反省の程度・被害感情・犯罪の社会的影響など、様々ある。そのうえ、こうした多くの事情をどう量刑判断に反映させるべきかについて、法律上は何らの規定も存在しない(岡田,2002)。もう1つの理由は、刑罰に幅があるからである。たとえば日本の場合、殺人罪には死刑が適用される場合もあれば、懲役5年の場合もあり、執行猶予がつく可能性さえある。このように、量刑判断は多くの事情を規定なしで考慮しなければならないうえに、広い幅の中から決めなければならないという判断である。それゆえ、量刑判断は特に不確実で、アンカーが影響しやすい。実際に、3つの先行研究すべてで量刑判断におけるアンカリング効果が示されている(Englich & Mussweiler, 2001; Englich et al., 2005, 2006)。たとえば、Englich & Mussweiler(2001)(実験1)では、検察官の求刑が裁判官の刑期判断に与える影響が検証された。その実験では、強姦事件の被告人に「検察官が懲役2ヶ月を求刑している」と伝えられた参加者群が平均で18.8ヶ月の刑期にすべきであると判断したのに対し、「懲役34ヶ月を求刑している」と伝えられた群は28.7ヶ月と判断した。どちらの群も求刑以外の判断材料は同じであったことから、10ヶ月もの刑期差が生じたのは求刑がアンカーとなったためであると考えられる。同様に、Englich et al.(2005)(実験1)でも、求刑が懲役12ヶ月の場合には9.6ヶ月と判断されたのに対し、34ヶ月の場合には16.8ヶ月と判断された。

求刑がアンカーとなる理由には、量刑判断に内在する不確実性という特徴に加え、説得における信頼性が挙げられる。刑事裁判のプロフェッショナルである検察官は、その意見が信頼に足る人物である。説得的メッセージは、送り手に信頼性がある場合に受け入れられやすいため(Wilson & Sherrell, 1993)、検察官による求刑も「あの検察官が懲役15年と意見しているのだから、懲役15年前後が妥当なのだろう」などと、判断者に受け入れられやすい。さらに、求刑はピンポイントである。「死刑から懲役5年まで」といった幅の中から決めなければならないという状況において、「懲役15年」といったピンポイントな求刑は有用であろう。

しかし、日本の場合は求刑以外にもアンカーになりうるものがある。それは、量刑分布グラフである。量刑分布グラフとは、過去の裁判例をデータベース化した量刑検索システムにより、類似事件に対する量刑がどう分布しているのかを示すものである(伊藤・前田,2010)。各地方裁判所の端末から最高裁判所に設置したセンターサーバーにアクセスし、検索画面で事件の概要や凶器の種類などのキーワードを入力すると、該当する事件の量刑区分別の件数が数値とともに棒グラフ形式で示される(伊藤・前田,2010)。裁判員に量刑分布グラフを見せる目的は、量刑判断の参考としてもらうためである(司法研修所,2012)。求刑と同様、必ずしもグラフに従って判断する必要はないが、裁判の経験も知識も少ない裁判員にとって、量刑分布グラフは重要な判断材料になる。

それでは実際に、量刑分布グラフはアンカーになるのであろうか。今のところ、調べられる限りではそれを検証した研究はない。しかし、いくつかの理由からその可能性は高いと考えられる。第1に、量刑判断にはそもそもアンカーが影響しやすいからである。第2に、裁判員は専門的知識や自信をほとんどもっていないからである。アンカリング効果は、判断に必要な知識がないと生じやすい(Mussweiler & Strack, 2000; Wilson, Houston, Etling, & Brekke, 1996)。さらに、裁判員経験者への取材から、裁判員は自らの判断についてなかなか自信をもてないことが知られているが(朝日新聞,2012年)、アンカリング効果は自信がないときにも生じやすい(Jacowitz & Kahneman, 1995)。第3に、量刑分布は規範的であるからである。先に挙げた2つの理由は求刑にもあてはまるが、第3の理由は量刑分布グラフに特有といえる。というのも、論告の一部である求刑は検察官に信頼性があるとはいえ、ただの意見にすぎない(刑事訴訟法293条1項)。裁判員の中には「担当の検察官の性格や経験によって求刑が違ってくるのではないか」などと考え、鵜呑みにはしない者もいるであろう。それに対して、量刑分布グラフは類似事件に対して日本各地の裁判所・評議体で出された全体的傾向であり、いわば規範的な判断である。求刑に比べれば、グラフに準拠する合理性はより高い。

その一方で、量刑分布グラフがアンカーにならないという可能性もないわけではない。「懲役15年」といったピンポイントな求刑とは異なり、グラフは「懲役1年以下が○件、懲役3年以下が○件…」といった広がりをもつ。そのため、グラフを見せると逆に判断がばらつく可能性もある。さらにいえば、「こうした理由から懲役15年にすべきではないか」といった説得的な求刑とは異なり、グラフは説得を目的としてはいない。それゆえ、量刑分布グラフがアンカーになるとは必ずしも言い切れず、実際に検証する余地はある。

しかし、検証の必要性はむしろ実際の裁判や司法制度における意義にある。量刑判断では多くの事情が考慮されなければならない。仮に、グラフによってたやすく裁判員の判断が変わるとすれば、事情の一部が無視され、適正な判断がなされなくなる危険がある。量刑判断は人の処遇を決めるという重大な判断であり、たとえグラフの影響が懲役1年程度であったとしても、その1年で被告人の運命が大きく変わってしまうことも考えられる。さらに、量刑分布が導入された当初の目的にかなっているかという観点からも、検証の必要がある。裁判員にとっての量刑分布グラフは参考とするためであるが(司法研修所,2012)、必ずしもその目的のとおりになっているとは限らない。現にアメリカでは、高額になるのを抑制する目的で賠償額に上限を設けている州がある。しかし、Robbennolt & Studebaker(1999)の実験では、「5,000万ドルを超えないように賠償額を決めてください」と説示することにより、参加者の判断が5,000万ドルにひきつけられ、かえって高額になるという、本来の目的とは逆の結果が示された。同じように、量刑分布グラフもただの参考にとどまらず、裁判員の判断を誘導してしまうかもしれない。さらに、グラフのどのような特徴がアンカリング効果を生じさせているのかが特定できれば、量刑分布のプレゼンテーションをどうすべきかといった実務にも生かすことができよう。

仮説

仮に、量刑分布グラフが裁判員の判断に影響するならば、グラフのどこがアンカーとなるであろうか。裁判員裁判の対象事件のグラフは、度数の最も多い部分、すなわちピークをもつものが多い1)。人は多数派の意見に従いやすいということも踏まえれば(e.g., Luchins & Luchins, 1961)、量刑分布グラフでアンカーとなるのはピークであろう。そこで本研究では、以下の仮説の検証を行った。

量刑分布グラフのピークは、アンカーとして素人の量刑判断に影響する。

実験1では、ピークがあるグラフを見せた参加者群とピークがないグラフを見せた参加者群の量刑判断を比較した。もし仮説が正しければ、ピークあり群の量刑は、ピークの方向にひきつけられると予測される。さらに実験2では、実験1を発展させ、量刑分布グラフのどのような特徴がアンカリング効果に寄与しているのかを検証した。

先行研究との相違点

本研究は、2つの点でEnglichらの研究(Englich & Mussweiler, 2001; Englich et al., 2005, 2006)とは異なっていた。1つ目は、事前判断の有無であった。Englichらは、量刑判断の前にアンカー(e.g., 懲役2ヶ月の求刑)よりも量刑が重くなるか軽くなるか、あらかじめ参加者に判断させていた。代表的研究であるTversky & Kahneman(1974)の実験手続きにならい2)、通常のアンカリング研究にはこうした事前判断がある。しかし、少なくとも本研究に関していうと、事前判断は適当ではない。というのも、実際の裁判で「今回の事件の量刑はグラフのピークよりも重くなるでしょうか? 軽くなるでしょうか?」と問う場面は考えにくいからである。さらにグラフには広がりがある。もしピークについての事前判断をさせてしまえば、参加者の注意はピークに集まってしまう。これでは結果的に「グラフによって判断がばらつく」という別の可能性をはじめから排除してしまう。また、Wilson et al.(1996)の研究では、アンカリング効果はアンカーを見せるだけでも生じた。それゆえ、本研究ではグラフを見せるだけにとどめ、事前判断はさせなかった。

さらに本研究は、重犯罪を実験材料にしたという点でも先行研究と異なっていた。重犯罪の量刑判断に対しては、被害の大きさや(Rucker, Polifroni, Tetlock, & Scott, 2004)、「犯罪者は厳しく罰されなければならない」といった信念が影響しやすいため(Jacobs & Carmichael, 2004)、アンカーの影響が相対的に弱い。一方で、Englichらの実験材料は、参加者の量刑判断が懲役3年程度に収まるくらいの犯罪であった。裏を返せば、Englichらの研究でアンカーが影響したのは、実験材料が重犯罪でなかったからとも考えられる。そこで本研究では、アンカーが影響しにくい重犯罪をあえて実験材料とすることで、こうした解釈をあらかじめ排除できるようにした。

実験1

実験課題は、公判の音声を聞き、量刑判断を含むいくつかの質問に回答することであった。結果を量的に分析するため、量刑判断には懲役刑の刑期(年数)を回答させた。それに合わせて、量刑分布グラフも死刑や無期懲役刑は含めず、「懲役刑5年未満」から「25年以上」まで5年刻みの有期懲役刑のデータとして実験者が作成した。グラフには2種類があり、一方にはピークがあったが、もう一方にはピークがなかった(図1)。ただし、2種類のグラフはいずれも、平均値(11.1年)・上限(25年以上)・下限(5年未満)においては同じであった(ただし、平均値を同じにする必要があったため、度数だけは異なっていた)。参加者はいずれか一方のグラフを「類似事件の量刑分布」として見た後、公判中の被告人に対して適当と思う刑期を決めた。

図1 実験1で参加者に呈示した量刑分布グラフ

上:ピークあり群、下:ピークなし群。

量刑分布グラフのどこにピークを設けるかという問題にあたり、126人の大学生を対象に予備調査を行った。その調査では、参加者に本実験と同じ公判音声を聞いてもらい、どれくらいの量刑が適当と思うか自由に判断させた。その結果、死刑14人・無期懲役刑42人・有期懲役刑70人(M=17.3年、SD=9.4)となった。この結果を踏まえると、ピークを重めにすれば天井効果が生じてしまいかねない。そのため、ピークの設定は、グラフの信憑性が損なわれない範囲で「懲役5~10年」と軽めにした。もし、仮説どおりピークがアンカーとして影響するのであれば、ピークあり群はなし群に比べて刑期を短くすると予測される。

方法

参加者

大学生80人(男性58人、女性22人、Mage=19.7, SD=1.3)が参加した。参加者は、グラフの種類だけが異なる質問紙により、2つの群にランダムに割り振られた(1要因2水準の参加者間計画)。グラフは刑期判断に関する質問項目(後述)の中で、次の説明文とともに呈示された。なお、グラフを参考にするかどうかは、実際の裁判と同じく、参加者の意思にゆだねていた。

「グラフは、過去11年間3)の刑事裁判で、この事件と同じような事件を起こした被告人たちが、どれくらいの懲役刑を科されたのかを示しています。もちろん、グラフを参考にしてもしなくてもかまいませんが、1人の裁判員としての自覚をもったうえで懲役刑の長さを決めてください。」

実験材料

実験材料は、粗暴事件の公判を録音した音声ファイルであり、パーソナルコンピュータと講義室の音響設備で再生した。公判音声は冒頭手続・被告人質問・論告などを含み、約25分間の長さであった。刑事裁判の資料に基づき、実験者がシナリオを作成し、4人の劇団員が裁判官・検察官・弁護人・被告人役を演じた。事件は、被告人(男性)が被害者(男性)と居酒屋でトラブルになり、被害者が居酒屋から出てきたところを待ち伏せして友人と2人で暴行し殺害したというものであった。凶器は、現場付近に落ちていたコンクリート片であり、それによって被害者は頭や顔などを何度も殴打されていた。被告人はいったん犯行現場から立ち去り、翌日になって警察に出頭した。あらすじとしては以上の内容であった。なお、実際の裁判では、量刑判断の前に被告人が有罪か否かを判断するが、本研究の目的から外れるため、有罪は既に確定しているという前提で省略した。また、検察官の求刑は慣例として論告に含まれているが、量刑分布グラフのアンカリング効果に干渉してしまう可能性があるため、本研究の論告には含めなかった。

質問紙

5ページで構成されていた。1ページ目は、研究目的と回答方法の説明、性別と年齢を記入する欄があった。目的は「裁判員の判断を調べるため」とし、実験的操作があることについては伏せていた。2ページ目は、裁判員の役割についての説明であった。3ページ目は公判の内容を書き取るためのメモ欄であり、4ページ以降の各質問に回答するときに自由に参照させた。4ページ以降は質問項目であった。1番目の質問は直感的な量刑感覚を問うものであった。具体的には、「どれくらいの重さの刑罰にすべきか?」という質問に対し、7件法(1:軽い刑罰~7:重い刑罰)で回答させた。2番目の質問は、被告人に対する懲役刑の刑期判断であった。刑期の範囲としては、日本の有期懲役刑で実際にありうる0~30年に設定した。このとき、ランダムに配布された2種類の質問紙によって、約半数の参加者はピークありのグラフを見て判断し、残りの半数はピークなしのグラフを見て判断した。3番目の質問では、グラフの平均値を推測させた。具体的には、類似事件の被告人たちが平均で何年の懲役刑を受けているかをグラフから推測させ、その年数を回答させた。

実験の流れ

教養科目の講義に出席していた大学生に、実験への協力を呼びかけた。謝金や講義への加点はなかったものの、刑事裁判への関心度が高かったせいか、ほとんどの者から任意参加の同意を得ることができた。次に、質問紙を配布し、目的と回答方法を説明した。回答にあたっては、実際の裁判員になったつもりで考えるよう、裁判員に選ばれる確率の高さや実験者の身近で選ばれた人の例を挙げるなどし、強く教示した。続いて3ページ目のメモ欄を開かせた状態で、公判の音声を流した。音声の終了後、実験者の合図とともに、4ページ以降の質問項目に回答させた。なお、質問紙の最後に□の欄を設け、公判を一部でも聞いていなかった場合はチェックを入れるよう求めた。実験に要した時間は、実験協力の依頼から参加者全員が質問紙に回答し終わるまでで約40分であった。デブリーフィングは、その1週間後に同じ講義室で行い、実験的操作としてグラフのピークの有無があったことと、その操作によって刑期判断にどれほど差が生じたかを20分ほどかけて説明した。

結果

分析にあたり、回答に欠損のある者2名と公判を聞いていなかった者2名の計4名分をデータから除き、残り76名(ピークあり群37名、ピークなし群39名)を分析対象とした。

刑期判断について、2つの群の平均値を比較したところ、ピークあり群は14.4年、ピークなし群は17.9年となり、3.5年の差があった(図2)。t検定の結果、その差は有意であり(t(74)=2.41, p=.02)、ピークあり群ではピークなし群よりも刑期が短く判断されていたことがわかった。なお、グラフを見る前に尋ねた直感的な量刑感覚(1:軽い刑罰~7:重い刑罰)の平均値は、両群にほとんど差はなかった(ピークあり群5.5(SD=0.9)、ピークなし群5.8(SD=0.9)、p=.16)。さらに、グラフから推測した平均値も、有意な差は見られなかった(ピークあり群11.5年(SD=3.5)、ピークなし群12.6年(SD=3.9)、p=.19)。

図2 実験1の刑期判断(平均値)

エラーバーは標準偏差を示す。

考察

実験1では、量刑分布グラフのピークがアンカーとして素人の量刑判断に影響するという仮説について検証した。聞いた公判はピークあり群もなし群も同じであったが、ピークあり群のグラフだけには軽いピーク(5~10年)があった。したがって、もし仮説が正しいならば、ピークあり群の判断は軽いピークにひきつけられ、刑期が短くなると予測される。実験の結果はこの予測どおりであり、仮説の正しさが確かめられた。

ところで、2群の間で見られた刑期差はピークによるアンカリング効果以外には考えられないであろうか。たしかに、2種類のグラフは平均値・上限・下限において同じであった。とはいえ、見た目はかなり違っており、読みとられた情報が異なっていた可能性もある。もし、ピークあり群がピークなし群よりも平均値を低く読みとっていたとすれば、そのせいで刑期が短く判断されたとも解釈できる。しかし、グラフから推測した平均値はどちらの群もかなり正確であり(実際は11.1年のところ、ピークあり群11.5年、なし群12.6年)、ほとんど差はなかった。したがって、平均値に限っていえば、読みとられた情報に違いはなかった。

それでは、グラフを見せる前の段階で既に判断が違っていたという可能性についてはどうであろうか。ピークあり群だけ、もともと刑期を短くする傾向があったとは考えられないであろうか。しかし本実験では、グラフを見る前に直感的な量刑感覚として「どれくらいの重さの刑罰にすべきか?」を7件法で尋ねていた。この回答は刑期と相関しており(ピークあり群r=.54、ピークなし群r=.55, ps<.001)、刑期判断を予測していたが、2つの群に差はなかった。したがって、2群の刑期差はグラフを見せた後に生じたと考えられる。

実験1では、その他にも興味深い現象が観察された。それは、過半数以上の参加者がグラフから推測した平均値よりも刑期を長くしたことである。その割合は、ピークあり群が67.6%(25/37人)、ピークなし群が66.7%(26/39人)であった。なぜ、推測値よりも長くしたのであろうか。予備調査の結果によれば、本実験の粗暴事件をグラフなしで判断させた場合は平均17.3年の刑期となる。この17.3年前後の刑期がグラフを見る前に想定されていたことが、その理由とも考えられる。すなわち、参加者は「懲役刑の刑期を決めてください」と言われた段階では17.3年くらいの刑期が適当と考えていたのであろう。そのため、刑期が軽いグラフを目の当たりにしても、それに抵抗して刑期を長くするという判断方略をとったと考えられる。

しかし、実験1には検証すべき問題が1つ残っている。それは、ピークをもつグラフのアンカリング効果にはグラフのどういう特徴が寄与しているのかという問題である。注目すべき1つ目の特徴は「ピークをもった量刑分布のデータ」である。つまり、「5~10年にピークがある」という情報が理解されたために、ピークがアンカーとなったという可能性である。もしそうであるとすれば、グラフでなく表であっても、ピークさえあれば量刑判断に影響を与えるはずである。2つ目の特徴は「絵で表現されている」である。つまり、グラフ中に視覚的誘目性の高いピークに判断がひきつけられたという可能性である。もしそうであるとすれば、ピークさえあれば量刑分布とは関係のないグラフであっても、量刑判断に影響を与えるはずである。グラフのどの特徴がアンカリング効果を生むのかという問題は、実際の裁判においても重要である。たとえば、絵という特徴が寄与しているとすれば、ピークが強調されたグラフはその強い影響により、裁判員の判断を誘導してしまう可能性などが考えられよう。

実験2

実験2では、量刑分布グラフのピークがアンカーとして影響することを確かめた実験1を発展させ、グラフのどのような特徴がアンカリング効果に寄与しているのか、さらに踏み込んだ検証を行った。なお、実験2の実験の流れ・材料・課題は実験1と同じであり、ピークの設定も軽め(5~10年)であった。

方法

参加者

実験1とは別の大学生161人(男性105人、女性56人、Mage=19.5, SD=1.2)が参加した。教養科目の講義中に、任意参加の同意が得られた参加者を対象に、集団で実施した。実験2でも、出席者の大多数が本研究に興味をもち、積極的に参加した。

独立変数は、量刑分布の有無および呈示方法であり、参加者は質問紙の種類によって以下の4群にランダムに割り振られた。1つ目は、ピークありの量刑分布グラフを見せた群であり、実験1のピークあり群と同じであった(グラフ群)。2つ目は、ピークありの量刑分布の表を見せた群であった(表群)(表1)。この表は、グラフ群の量刑分布グラフを表に変えただけであり、「ピークをもった量刑分布のデータ」という特徴においてグラフ群と共通していたが、「絵で表現されている」という特徴はなかった。3つ目は、量刑分布グラフをタイトルだけ変えて見せた群であった(別グラフ群)。具体的には、「類似事件の被告人が出所後何年以内に再犯をするかについてのグラフ」として見せた。つまり、このグラフはグラフ群が見たグラフと全く同じ形状であり、「絵で表現されている」という特徴において共通していた。しかし、「ピークをもった量刑分布のデータ」という特徴はなかった。以上3群に見せたグラフおよび表は、平均値・上限・下限だけでなく、ピークも度数(被告人の人数)も全く同じであった。4つ目は、2つの特徴がそれぞれどれくらい影響しているのかを調べるため、ベースラインとしてグラフも表も見せない群を設けた(統制群)。以上のとおり、実験2は1要因4水準の参加者間計画であった。

表1 実験2の表群に見せた量刑分布グラフの表「1998~2008年における類似事件の量刑分布」
刑期(年)被告人の人数
5年未満30
5~10年未満78
10~15年未満54
15~20年未満44
20~25年未満10
25年以上3

実験材料および質問紙

実験1と同じ公判の音声ファイルを用いた。質問紙は基本的に実験1と同じであったが、独立変数の操作にかかわる部分、すなわち量刑分布の有無および呈示方法が変更され、4種類があった。なお、「類似事件の被告人たちが平均で何年くらいの懲役刑を受けているか」を推測させる質問では、統制群のみ他の3群と異なり、参加者自身の予想に基づき回答させた(グラフも表も見せられていないため)。実験1同様、回答にあたっては裁判員になったつもりになるよう教示し、公判を聞いていなかった場合は、質問紙の最後に設けた□欄にチェックを入れさせた。実験2は約45分かかり、デブリーフィングは1週間後に同じ講義室で行い、実験的操作と刑期判断の結果を説明した。

結果

分析にあたり、回答に欠損のある者4名と公判を聞いていなかった者12名分のデータを除いた。さらに、表群のうち1名が極端に誤った平均値推測をしていたため(実際の11.1年に対して30年)、そのデータも除いた。その結果、残り144名(グラフ群38名、表群39名、別グラフ群36名、統制群31名)が分析対象となった。

図3に各群の刑期平均値を示す。全体的に見て、最も短かったのはグラフ群(14.6年)であり、長かったのは別グラフ群(18.6年)と統制群(18.4年)であった。表群は15.8年であった。これら4群で分散分析をした結果、量刑分布の有無および呈示方法に主効果が認められた(F(3,140)=2.94, p=.04)。多重比較の結果、グラフ群は別グラフ群および統制群に比べて有意に刑期が短く判断されていたことがわかった(それぞれp=.01, p=.02)。なお、表群は別グラフ群および統制群に比べてそれぞれ2.8年、2.6年短く判断されており、前者には有意傾向があったが(それぞれp=.08, p=.12)、グラフ群との間では有意差はみとめられなかった(p=.45)。

図3 実験2の刑期判断(平均値)

エラーバーは標準偏差を示す。

刑期判断の前に尋ねた「どれくらいの重さの刑罰にすべきか?」という直感的な量刑感覚(1:軽い刑罰~7:重い刑罰)の平均値は、グラフ群5.8(SD=0.8)、表群5.6(SD=0.7)、別グラフ群5.7(SD=0.6)、統制群5.9(SD=0.9)であり、ほとんど同じであった(p=.37)。推測した刑期の平均値は、低い順に、別グラフ群9.4年(SD=3.6)、グラフ群11.1年(SD=3.9)、表群11.6年(SD=3.6)、統制群15.7年(SD=5.2)となった。実際の平均値11.1年と比較すれば、グラフ群と表群の推測値はかなり正確であったといえる。分散分析の結果、独立変数の主効果が認められ(F3,140)=13.99, p<.001)、その後の多重比較により、別グラフ群とグラフ群の間(p=.08)およびグラフ群と表群の間(p=.54)を除き、他のすべての組み合わせで有意差が認められた(ps<.02)。別グラフ群が特に低い推測値であった点に関して、本実験の結果からはその原因を特定することはできないが、被告人が再犯するまでの年数とその刑期との間に何らかの関連性が想定されたせいと考えられる。

考察

実験2では、量刑分布グラフのどのような特徴がピークによるアンカリング効果に寄与しているのかについて検証した。その結果、特にピークの影響が見られたのは量刑分布をグラフで見せた群であった。同じ量刑分布を表で見せた群でも統制群との差はあったが、グラフ群に比べればはっきりとした影響ではなかった。また、全く同じ形状のグラフであっても、量刑分布でなければ影響しなかった。以上の結果から、ピークのある量刑分布グラフのアンカリング効果は、「ピークをもった量刑分布のデータである」と「絵で表現されている」の2つの特徴がともに寄与していると考えられる。言い換えれば、量刑分布のデータであるということを前提として、誘目性の高いピークがある場合は特に、アンカリング効果が生じやすいと考えられる。

さらに、実験2により、実験1の考察の正しさを確認することができた。実験1では、グラフから推測した刑期においてピークあり群となし群はほとんど同じであったが、グラフの影響はピークあり群だけに見られ、なし群には見られなかった。実験1は、この結果に基づき「量刑分布グラフの影響はグラフから読みとられた情報のせいではない」と考察した。実験2でも、グラフ群と表群とで推測した刑期の平均値はほとんど同じであったが(11.1年 vs. 11.6年)、量刑分布の影響がはっきり見られたのはグラフ群であった。さらにいえば、実験2のグラフと表は「グラフか表か」というただ1点を除けば全く同じであった(実験1の2種類のグラフは度数も形も異なっていた)。したがって、量刑分布グラフの影響はやはり、読みとられた情報が違っていたせいではないと考えられる。

実験1の「ピークあり群となし群における刑期差はグラフを見た後で生じた」という考察も正しかった。実験1と同様、実験2でも直感的な量刑感覚は刑期と相関していたが(グラフ群r=.47、表群r=.64、別グラフ群r=.64、統制群r=.48, ps<.01)、4群の間で差はなかった。つまり、実験2における刑期差も、量刑分布グラフや表を見せる前の段階ではなく、見せた後になって生じていた。

さらに実験1では、多数の参加者がグラフの推測値よりも刑期を長くしていたという結果から、「グラフ前に適当と考えていた刑期が長かったため、グラフに抵抗して刑期を長くする方略をとった」と考察した。実験2においても、推測値より刑期を長くした参加者の割合は大きく、グラフ群が61%(23/38人)、表群が69%(27/39人)、別グラフ群が78%(28/36人)、統制群が68%(21/31人)いた。特に興味深いのは、統制群である。統制群には量刑分布に関するグラフも表も与えられていなかったため、その推測値は参加者自身の予想にすぎなかった。それでも統制群でそうした方略がとられたのは、「一般的に刑事裁判は被告人に甘く、平均の刑期は短い」という観念のようなものがあり、自身が適当と考える長い刑期との間で調整を図ろうとした可能性がある。いずれにせよ、「推測した平均値より長くする」という判断方略は、グラフなど客観的な情報を与えられた場合に限らず、主観に基づく推測の場合にも使われやすいということが示唆される。

もっといえば、実験2は実験1の仮説をより厳密に確かめたともいえる。実験1では、ピークあり群の刑期が短くなったという結果から、ピークがアンカーとして影響したと考察した。ただしそこには、実験材料の重犯罪に対してピーク(懲役5~10年)は軽いはずであるとの前提があった。もちろんこれは予備調査の結果に基づく前提であるが、「ピークあり群の刑期が短くなったのではなく、ピークなし群の刑期が長くなった」という別の可能性を完全に否定することはできない。実際に、ピークなし群のグラフは25年以上の度数がやや多く(図1)、そこに判断がひきつけられたとも考えられる。しかし、実験2でグラフも表も見ていない統制群の刑期(18.4年)は、グラフ群(14.6年)や表群(15.8年)より長く、実験1のピークなし群(17.9年)とほとんど同じであった。したがって、実験1ではやはり、ピークなし群の刑期が長くなったのではなく、ピークあり群の刑期が短くなったのであり、ピークがアンカーとして影響したという考察は正しかったと考えられる。

総合考察

先行研究との関連

これまでの研究は、検察官の求刑によるアンカリング効果について検証を行ってきた(Englich & Mussweiler, 2001; Englich et al., 2005, 2006)。一方で、本研究はもう1つのアンカーとして量刑分布グラフを取り上げ、グラフのピークがアンカーとして参加者の刑期判断に影響することを示した。さらに、実験2では、量刑分布グラフのアンカリング効果に「ピークをもった量刑分布のデータである」と「絵で表現されている」の2つの特徴が寄与していることを示した。

別のアンカーを検証したという点以外にも、本研究とEnglichらの研究とではいくつか異なる点があった。1つ目は事前判断の有無であった。Englichらは、量刑判断の前に、量刑がアンカーよりも重くなるか軽くなるかを参加者に判断させていたが、本研究ではそのような事前判断がなく、参加者は量刑分布グラフを見ただけであった。さらにいえば、本研究ではグラフを参考にするかどうか自体も参加者の意思にゆだねていた。しかし、それでも明確なアンカリング効果が見られた。2つ目は実験材料の違いであった。軽犯罪に比べ、重犯罪では被害の大きさ(Rucker et al., 2004)や信念(Jacobs & Carmichael, 2004)が量刑判断に影響しやすいため、相対的にアンカーの影響が弱い。その意味では、懲役3年相当の犯罪を材料にしたEnglichらの研究ではアンカーが影響しやすかったといえる。一方で、本研究の材料は、男性1人が殺害されたという内容の重犯罪であった。重犯罪を用いた本研究により、量刑判断におけるアンカリング効果は犯罪の重さにかかわらず生じるということが明らかになった。もう1点補足すると、Englichらの研究は記述された公判シナリオを用いたが、本研究は公判の音声を用いていた。その長さは約25分間あり、情報量も豊富であった。この点で、本研究は実際の裁判により即していたといえる。

裁判や司法制度との関連

実際の裁判や司法制度に対し、本研究はどういうことを示唆しているであろうか。注目すべきところは、直感的な量刑感覚とその後に測った刑期判断との関係である。実験1でも実験2でも、直感的な量刑感覚を尋ねた段階において、群間に差はなかった。つまり、公判を聞いて「これくらいの重さの刑罰にすべきだと思う」というところまでは同じ判断であった。しかし、その後、具体的な刑期を決める段階で差が生まれた。この差は刑期判断の際に見せられた量刑分布グラフによる影響(実験2は表の弱い影響)である。つまり、直感的な量刑感覚は同じでも、ピークありのグラフや表によって年数だけが変わってしまっていた。このことから、グラフの影響は、直感を具体的な刑期に換算するときのごく表層的な影響であることが考えられる。もしそうであるとすれば、実務面では量刑分布のプレゼンテーションが重要な問題になってこよう。たとえば、実験2では、表よりもグラフの量刑分布で強いアンカリング効果が見られたが、この結果はピークの誘目性を高めたグラフ、たとえばピークに特別な配色がされたグラフなどにおいて特に強いアンカリング効果が生じやすいということを示唆している。もし、こうしたグラフが用いられれば、裁判員の判断がピークへと誘導されてしまう危険性がある。

次に、量刑分布グラフが導入された当初の目的にかなっているかという観点から考察する。裁判員にとっての量刑分布グラフは参考のためであるが(司法研修所,2012)、本研究から示唆されるのは、量刑分布グラフが裁判員の判断を誘導してしまうかもしれないという可能性である。裁判員にとって、グラフは有用な判断材料であるが、そのピークがアンカーとして影響しすぎると、類似事件はすべて均一的な量刑になってしまう。仮に2つの類似事件があり、罪種・被告人の前科や年齢・犯行の方法などデータベース化できる事情がすべて一致していたとしても、被告人の複雑な生い立ちや被害感情の大きさなど、データベース化しにくい事情は全く違っているかもしれない。また、先述のとおり、グラフの影響が直感を量刑へと換算するときの表層的な影響であるとすれば、被告人の生い立ちや被害感情が裁判員の直感に影響していたとしても、グラフによってその影響が弱められ、他の類似事件とほとんど同じ量刑に落ち着いてしまうかもしれない。量刑分布グラフが目的にかなっているかどうかは、裁判員にとって参考としての役割にとどまるのか、あるいはそれ以上の影響力を有するものであるのかどうかにかかっていると考えられる。

課題と展望

本研究から得られた知見は、実際の裁判においてどれほどあてはまるのであろうか。本研究の参加者は大学生であり、実験材料は約25分間の公判音声であった。一方で、裁判員は教育歴や職業などが様々な老若男女であり、数日間にわたる公判を見聞きした後、量刑判断にのぞむ。これらの違いにより、本研究の参加者と実際の裁判員とで判断が異なってくる可能性もある。しかし、陪審員の判断研究によれば、大学生を参加者としシナリオや音声などの材料でも、実際の裁判を分析した研究と同じ結果が得られることが示されている(Bornstein, 1999)。さらに、本研究では参加者に対し、「実際の裁判員になったつもりで回答するように」と口頭でも質問紙でも強く教示した。裁判員に選ばれる確率の高さや実験者の身近で選ばれた人の例を挙げるなど、裁判員としての意識を強くもたせる工夫もした。それゆえ、本研究の参加者の判断が裁判員の判断とかけ離れているとは考えにくい。しかし、本研究の知見を実際の裁判に生かすためにはやはり、裁判員になりうる人々を対象に模擬法廷実験をするなどの再検証も必要である。

また、量刑判断のアンカーは量刑分布グラフだけではなく、求刑もある。別のアンカーである求刑が量刑分布グラフのピークと一致しなかったとき、たとえば求刑が「懲役15年」でピークが「懲役5~10年」であった場合には、裁判員はどちらにひきつけられるのであろうか。裁判への応用ということを念頭におけば、この点についても調べる必要がある。

実験2の考察に関しても、詳しい検証が必要であろう。実験2では、表よりもグラフの量刑分布で強いアンカリング効果が見られたという結果から「誘目性の高いピークがある場合は特にアンカリング効果が生じやすい」と考察した。しかし、もし誘目性がアンカリング効果に寄与するのであれば、ピークの配色あるいは尖度を操作することによって、アンカリングの効果が変わると予測される。今後はこうした検証も行っていく必要がある。

また、本研究で偶然得られた結果に「推測した平均値より刑期を長くする」という判断方略があった。実験1、2のどの群でも60%以上の参加者が推測値よりも刑期を長くしており、グラフや表なしの主観に基づく推測でもこの方略がとられていた。これは、どういう心理の表れなのであろうか。1つには、自らの判断として表明するにあたり、多数派の判断そのままではなく、何らかの味つけをしたいとの思いが反映されているとも考えられる。仮にそうであるとしたら、その味つけが全体として辛口すなわち長めになるのはなぜであろうか。本研究の場合、実験材料は重犯罪であったのに対して軽いピークであったということも理由の1つと考えられよう。軽犯罪を実験材料とした場合や、ピークを操作した場合にも同様に見られるのであろうか。素人が量刑を決める心理プロセスを明らかにするうえで、これらの疑問についての検証が重要な手がかりとなる可能性もある。

References
 
© 2014 The Japanese Society of Social Psychology
feedback
Top