イノベーション・マネジメント
Online ISSN : 2433-6971
Print ISSN : 1349-2233
論文
実験会計研究の未来
坂上 学田口 聡志上枝 正幸廣瀬 喜貴
著者情報
ジャーナル フリー HTML

2020 年 17 巻 p. 21-37

詳細
要旨

本稿は、まず会計研究における実験研究の位置づけと、さまざまな領域における実験研究の現状を紹介した上で、どのように未来を切り開いていくべきかについて、「未来志向」「因果関係」「総力戦」といった視点からその方向性を探っている。続いて、新たな方法論的な試みとして注目を集めている事前登録制度やオンライン労働市場を利用することの意義について検討をおこない、それぞれが再現可能性を高め外的妥当性の問題を解決しうる可能性を秘めていることを示す。さらに、外的妥当性へのチャレンジとして研究プラットフォームとして期待のかかるAmazon Mechanical Turk、SurveyMonkey Audience、Qualtrics等を用いたオンライン実験の動向について、「コスト」「柔軟性」「関心のある集団へのアクセス可能性」といった視点から検討するとともに、近年増加傾向にあるリーダビリティ実験など最新の実験会計研究についても概観する。最後に、今後の研究プラットフォームとして注目されているoTreeなどを利用することにより、相互作用のあるオンライン実験の可能性についての展望を示す。

Abstract

This paper firstly evaluates the current status of experimental research in accounting research and various accounting fields and how experimental accounting is looking to the future from the perspective of “future-orientation”, “causal relationships”, and “unified strategy”. Next, we examine the significance of using pre-registration and online labor markets, which are attracting attention not only as new methodological initiatives but also for their potential to increase reproducibility and to solve external validity problems.

Furthermore, regarding the recent trend toward online experiments using Amazon Mechanical Turk, SurveyMonkey Audience, Qualtrics, etc., which are highly anticipated new research platforms for overcoming the problem of external validity, we compare these platforms in terms of cost, flexibility, and accessibility to interest groups. The latest experimental accounting research such as readability experiments, which have been increasing in recent years, is also reviewed. Finally, we review the prospects for interactive online experiments using tools such as “oTree”, which is gaining profile as a future research platform.

1.  はじめに

経済学者のMill(1844)はその著書の中で、経済学は仮説検証という演繹的な方法を取るべきで、帰納的な方法をとるべきでないと主張しているが、これはベーコン哲学でいうところの「決定実験」(experimentum crucis)を明確に否定したことを意味しており(Louca, 1997, 32)、それ以来、長らく経済学において実験的手法は「不可能」ないしは「意義のないもの」であるとの認識が一般的であった。しかしながらChamberlin(1948)が実験的手法を経済学に導入したことを嚆矢として、その後ヴァーノン・スミス(Vernon Smith)やアルビン・ロス(Alvin Roth)らによって実験経済学が確立されると、2002年には行動経済学者のダニエル・カーネマン(Daniel Kahneman)とともにヴァーノン・スミスがノーベル経済学賞を受賞したことで、実験経済学の手法が広く認知されるようになった。さらに、z-Tree(Fischbacher, 2007)やoTree(Chen, Schonger, & Wickens, 2016)といった無料の実験用プログラムが公開されたこともあり、現在では多くの研究者が実験経済学の領域に参入するようになっている。

会計研究における実験的手法はこれまで、シャム・サンダー(Shyam Sunder)を中心として、前述した実験経済学の手法に依拠して推移してきたといえるが1、経済学の均衡概念などを用いて分析的に解析し、その結果を基に仮説を立て、その仮説どおりに果たして人が行動するかどうか、被験者に金銭的なインセンティブを与えながら、実験室もしくはフィールドにおいて被験者の行動を観察し、そこで得られた結果により仮説の妥当性を検証するといった複雑で手間のかかるステップを踏む必要があった。このため、とりわけ分析的研究をおこなう研究者が少ない日本においては、実験研究に果敢に取り組むことが少なかったように思う。このような状況下において、会計研究における実験的手法の現状と課題を明らかにしたうえで、実験会計研究の未来について展望するのが本稿の目的である。

まずは会計研究における実験研究の位置づけや、さまざまな領域における実験研究の現状を紹介し、どのように未来を切り開いていくべきか、その方向性を示すとともに、最新の実験研究の動向について概観する。続いて、新たな方法論的改善の試みとして注目を集めている、事前登録制度(pre-registration:プレレジ)とオンライン労働市場(online labor markets)の利用について取り上げる。さらに、最新の研究プラットフォームとして期待のかかるAMT(Amazon Mechanical Turk)を利用したオンライン実験の動向(Brandon et al., 2014)や、リーダビリティ実験(Rennekamp, 2012)とその後の展開など、最新の実験会計研究について概観する。最後に、これらの新たな研究動向が会計研究全体に与えるインプリケーションと、実験会計研究の展望について述べることにしたい。

2.  実験×社会で未来を切り拓く

本節では、あとの議論の前提として、広く社会科学全体における実験研究の位置付けについて述べることにする。近年、社会科学研究全体において、実験的手法の重要性が高まっている(西條・清水編, 2014)。特に、開発経済学や環境経済学の領域においては、その傾向が強まってきている(Banerjee & Duflo, 2011等)。

実験研究は、他の方法論と比較して、原因と結果の関係を厳密な統制条件のもと捉えることができることから内的妥当性が高く、かつ事前検証性(現実にはまだない制度や仕組みを実験室やフィールド内に創出し、そのもとでの人間行動に係るデータを採取することができること)を有するため、経済学のみならず、政治学や経営学など社会科学研究において注目が集まっている手法といえる。

会計学においても、特にアーカイバルデータの入手が難しい管理会計や監査論の領域を中心に、国内外でその重要性が大きく高まっている。さらには実験室でおこなうラボ実験だけでなく、フィールド実験なども会計研究に徐々に取り入れられており2、実験研究は、将来有望な手法のひとつといわれている3

そして特に、ここでは、実験を語る上で重要な3つのキーワード、すなわち「未来志向」、「因果関係」、「総力戦」を挙げておこう。

2.1  未来志向

第一のキーワード「未来志向」について、たとえば、2017年度にノーベル経済学賞を受賞したリチャード・セイラー(Richard Thaler)は、「ナッジ」と呼ばれる人々の行動を変容させる「仕掛け」を用いることで、人々の行動をより望ましいものへと変えうることを、数々の実験研究から示している(Thaler, 2015)。また、2012年度にノーベル経済学賞を受賞したアルビン・ロス(Alvin Roth)は、市場がないところに市場を作る「マーケットデザイン」の発想で、医療に係るマッチングや学校選択制など、社会に新しい仕組みを作ることで社会をより良くする実験研究を進めている(Roth, 2015)。

このように、実験は、その事前検証性という特質から、未来をデザインすることで、社会をより良くすることを志向する研究と相性が良い手法であるといえる。

2.2  因果関係

第二のキーワード「因果関係」について、実証のゴールド・スタンダードは、因果関係(causal effect)の識別にあるといわれており、また、因果関係を掴む際のカギは「反実仮想」(counterfactual)にあるとされる。しかし、現実世界における既存データの枠組みでは、これを捉えるのは困難であるから、この「反実仮想」にどう対処するかが因果関係を掴むポイントとなる。この点について、Floyd and List(2016)によれば、これへの対処の方向性は大きく2つあるという(p.440)。

第一の方向性は、あくまで既存データの枠組みで対処する(計量的手法を進化させる)ことであり、具体的には、自然実験(natural experiment)やプロペンシティ・スコア・マッチング、IV(Instrumental Variables)、構造推定などの手法で、「反実仮想」(そのものではないが、そのように代理できるもの)をあぶり出すことが考えられる。

また第二の方向性は、データを「作って」対処することであり、これが実験ということになる。実験により「反実仮想」を仮想的に作り上げることで、より強いエビデンスレベルの因果関係を捉えることができ、そのことにより、理論の検証をより高いレベルでおこなうことができるのが、実験のもつ大きなパワーといえる。

2.3  総力戦

第三のキーワード「総力戦」について、現実の社会はより複雑化しており、何らかの経済現象の背後にある因果関係を捉えようとする際には、領域を超えた研究者(経済学者、社会学者、心理学者、政治学者、経営学者、会計学者、生物学者、神経科学者など)が集まり「総力戦」でアタックしていく必要がある。その際に鍵となるのは、現実の抽象化である。すなわち、現実の経済現象を抽象化し、「仕組み×人間」のモデルに如何に落とし込むかが重要なポイントとなり、ひとたびこの抽象化ができれば、(たとえば会計に関する経営者の何らかの意思決定の問題であっても)多くの研究者が一緒にその問題に取り組むことができる。

その際に共通言語となるのが、ゲーム理論であり、また実験である。ゲーム理論や実験は、予測し(predict)、説明し(explain)、そして処方する(prescribe)ために有用なツールであるし(Camerer, 2003)、分野を問わず用いることのできる共通言語であるため、多くの研究者が「総力戦」に取り組むことができるプラットフォームとして機能するといえる。

このように、実験研究は、今後の未来社会を捉える上でも非常にパワフルな手法であるといえるが、他方で、現在、大きく2つの意味での「分岐点」に立たされている。それが、「再現性」の問題であり、また「外的妥当性へのチャレンジ」でもある。以下の節では、これらについて論じることにする。

3.  事前登録制度とオンライン労働市場

実験会計研究においては、関心のある会計上の論点の実証に際し、ヒトである実験参加者(被験者)の統制(コントロール)された環境のもとでの実際の判断や意思決定を分析対象のデータとして用いる。これら特徴は、(1)事前に、適時に、かつ包括的に実験実施の以前には存在しない適切なデータを取得する機会、および(2)変数間の因果関係の推論にまで迫りうる可能性などを研究者に与えるものである。とはいえ、一方では、これらの特長、換言すれば実験研究の比較優位性(Libby & Luft, 1993, 428)を十全に発揮するには、方法論に固有の制約ないし取り扱いが悩ましい問題が付きまとうため、長年に亘って同じような議論が繰り返さなされてきたのも事実である(Swieringa & Weick, 1982Berg et al., 1990)。

本節では、概ね2010年代半ば以降の最近の実験会計研究の方法論上の試みとして、(1)事前登録制度(pre-registration;プレレジ)、および(2)オンライン労働市場(online labor markets)の利用を取り上げることにする。

前者の(1)事前登録制度(プレレジ)のもとでは、実証研究の実施にあたり、データの収集方法や標本規模、分析手法などの詳細を事前に決定して第三者機関に登録し、原則として、登録内容に沿って研究が遂行されることになる。事前登録制度(プレレジ)の適用は、「実証研究の実施にあたり」と前文で指摘したように、実験研究の論点に限定されるものではない。しかしながら、当該制度によれば、関与者以外の第三者が他のグループによる研究の追試(reproduction)を遂行しようとする場合に、再現可能性(reproducibility)を高めるという効果が第一に期待され、実験研究に一般的に投げかけられる疑念である内的妥当性(internal validity)の問題への一定の対処法となりうるのである。なお、内的妥当性とは、従属変数(の変化)が独立変数(の変化)に起因してもたらされたといえる程度のことをいう。

さらに、後者の(2)オンライン労働市場の利用に関しては、実験研究の外的妥当性(external validity)、すなわち実験から得られた知見の現実世界への一般化可能性(generalizability)の問題との関連だけではなく、実験会計研究の実施全般に対する影響という観点からも重要であると考えられるものである。

3.1  再現可能性と事前登録制度・査読付き事前登録

2010年代に入ってから、とくに心理学界において、研究不正やいわゆる疑わしい研究実践(questionable research practices: QRPs)が大きな問題となってきている。たとえばそれらは、pハッキング(p-hacking)やHARKingとよばれるものから、データ分析の実施「後」に統計的な有意差が検出されたもののみを論文に載せる方法などさまざまな形態をとる。なお、ここでpハッキングとは、統計的に有意な結果が得られるよう、ある特定のデータを分析から恣意的に除外する、あるいは新たな実験セッションを追加的に実施してデータを追加するなどの方法によってp値(p-value、有意確率)を下げようとする行為であり、またHARKingとは、一仮説検証型の研究の通常の順序とは反対に、検証結果を確認してから仮説を生成する行為である。

これらは何れも、研究結果を実際よりもよく見せ、よって論文の公刊の可能性は高まるかもしれない。しかし、同時に、第三者の手による研究の追試において、結果が再現できない、あるいは原論文で報告されたものとはかけ離れた結果が出るなど、学界と一般社会に対する貢献が著しく低いものとなる。冒頭に挙げた心理学界の例を引き合いに出すと、再現可能性が乏しい先行研究の多さに加え、John et al.(2012)による巧みに本心を引き出そうとする努力がなされた質問紙研究の結果、程度の差こそあれ、3割以上の心理学研究者が研究不正や疑わしい研究実践(QRPs)を行ったことがあると推計されたことから、過去の研究結果、ひいてはそれらに依って立つ心理学という学問分野自体に疑念が呈されたのである。

実験会計研究においては、筆者の知るかぎり、上記の研究不正や疑わしい研究実践(QRPs)の問題が大きくクローズアップされている事実はない。しかしながら、研究結果の第三者による再現可能性の低さの問題に関しては、決して対岸の火事とはいえない。たとえば、このあと本小節で詳しくみるBloomfield et al.(2018, 316)は、ある研究会議の参加者らを対象としたアンケートの結果、先行研究を追試しようとした113人のうち105人が上手くいかなかったと回答したと述べている。追試の失敗の主たる原因は、原論文の記述からは同様の研究手続が実施できないという、研究過程の透明性の欠如にあるとされる。何れにせよ、他の研究分野と同様に、会計学においても実証研究の再現可能性が問われていることは疑いないものと考えられる4

再現可能性の低さという問題への対処法の一つとして、事前登録制度(プレレジ)が考えられうることを既に述べた。実験の研究過程の詳細を事前に決め、公開することにより、第三者の追試に関する透明性の問題も、また研究不正や疑わしい研究実践(QRPs)に関わる問題も、相当程度は深刻さが減殺されるものと考えられる。事前登録制度(プレレジ)をさらに推し進めたのが、査読付き事前登録制度(registered report、レジレポ)、すなわちプレレジ時点でなされる査読によって「仮」アクセプトされると、原則として、データ取得後の分析の結果とは関係なく論文が専門誌に掲載される方式である。

折しも、会計学の専門誌の一つであるJournal of Accounting Research(以下JAR)誌は、登録に基づく編集プロセス(registration-based editorial process: REP)と同誌がよぶ、査読付き事前登録制度(レジレポ)を採用した号(Vol.56, No.2, May 2018)を刊行している。同特集号は実験会計研究のみを対象としたものではないが、全体で71本の投稿から8論文がアクセプト(採択率は約11.3%)されたうち、実験会計研究の投稿数は14、受理数は4(採択率は約28.6%)となっている。以下では、同号における代表的な実験会計研究としてBernard et al.(2018)を紹介したのち、伝統的な編集プロセス(traditional editorial process: TEP)と同誌がよぶ、分析結果も含めた研究プロジェクトの全容をまとめた完全な論文が査読に供される方式との間の差異を検討したBloomfield et al.(2018, 316)をみていくことにする。

Bernard et al.(2018)は、少額でもある会社に投資することが、個人投資家の消費行動や産業に対する規制の選好にどのように影響を及ぼすのかを調査する。彼らの実験では、269人の大学院生の参加者に対し、Starbucks社を含む4社のうち無作為に選ばれた1社の$20分の投資を学期の初めに賦存し、学期末の特定日にその時価で報酬を与えることにした。彼らは、心理学の知見から仮説を導出し、ある会社への少額の投資により、個人は、当該会社の製品ここではStarbucks社の飲料の消費を増やし(仮説1)、会社が属する産業にとって有利な規制を選好する度合いを高める(仮説2)と推論する。すなわち、ヒトは、(i)投資を通じて関係をもった会社の株価を上げたいと考え、かつ同社製品の購入や同社に有利な規制の実施はその後押しになるという信念を抱き、(ii)関係をもつ会社に対して好意的な感情を単純に有するようになり、あるいは、(iii)同業「他社」の製品を購入したり、産業にとって不利な規制が実施されたりすることで引き起こされる認知的不協和(cognitive dissonance)を避けるため、上記のような行為がなされるとされたのである。

Bernard et al.(2018)の実験結果は、専門誌に掲載される学術論文を読み慣れた者にとっては、驚くべきものといえる。消費量の増加(仮説1)と会社に有利な規制の選好(仮説2)に関する平均の差の検定においては、p値は、0.70−0.07ではなく−を超えるものだったのである。仮説と首尾一貫しない結果に続いてなされた追加の分析においても、コーヒーや紅茶などStarbucks社の主力製品と同一範疇の製品を以前から愛飲していたという属性が参加者にあれば、少額の投資が購入行動や規制への選好に影響することが示唆されたのみであった。すなわち、他社製品を購入するくらいなら、Starbucks社の製品を選ぼうというくらいの効果しかないかもしれないのである。

以上のBernard et al.(2018)らの論文掲載号の編集を受けた、Bloomfield et al.(2018, 313 and 355)の表題および結論は、「どのような編集方式も一長一短がある(No system is perfect)」というものである。すなわち、査読付き事前登録制度(レジレポ)のもとでは、研究「計画」段階に資源がより重点的に投入される結果として、第三者による研究の再現可能性が向上することは疑いないものの、「事後的な」フォローアップが減少することになり、学術論文全体としての完全性と洗練性の度合いは低下することになる。さらに、査読付き事前登録制度(レジレポ)の適用がなされると、当初に設定されたすべての仮説が検証され、その結果が報告されることから、論文の読者にとってのセレクション・バイアスは比較的に低いものとなる。すなわち、研究者にとって都合のよい、統計的な有意さが検出された関係のみが選択・報告されているのではないことはわかる。しかし、先にみたBernard et al.(2018)稿に代表されるように、統計分析の結果として仮説の多くが反駁された場合、学問的な貢献の小さい研究が公刊されることとなり、これは研究のプロポーザルをアクセプトした査読者にとっても、また論文の著者自身にとっても、その対処に困る悩ましい事態に陥る可能性があるかもしれない。このため、Bloomfield et al.(2018, 356)は、何れの方式も一長一短があるならば、査読付き事前登録制度(レジレポ)のもとでは著者が事後的に裁量を行使しうる基準を明確化する一方で、JAR誌のいう伝統的な査読方式(TEP)のもとでは研究過程の透明性を高める、といった両者の長所を活かすような歩みよりの工夫が必要であるとしている。

繰り返しの指摘となるが、事前登録制度(プレレジ)や査読付き事前登録制度(レジレポ)の適用は、実験研究に限定されるものではない。とはいえ、実験研究の方法論の特徴の一つは、新たな「現象を創出する」(Swieringa & Weick, 1982, 71)ことにあり、また実験者による結果の恣意的な操作や「無理強い(forcing the hand)」(Berg et al., 1990, 839)が第三者から懸念されることもあることから、同制度との親和性は比較的に高いといえよう。このため、実験会計研究の未来を想定するさいには、今般のJAR誌の試みを念頭に置き、さらに心理学など他の学問領域の今後の動向についても注視しておく必要があるだろう。

3.2  外的妥当性の問題とオンライン労働市場

株価や財務諸表数値など現存するデータを分析するアーカイバル研究(archival research)とは相違し、実験研究は、ヒトの参加者による実際の判断・意思決定のデータを分析の対象とする。したがって、いかなる層のどのような立場のヒトが参加者となるかは、決定的な重要性をもつことになる。さらに実験会計研究においては、監査人、証券アナリストや経営管理者のような専門家、さらにある程度の知識と経験を有する投資家などの特定の利害関係者層が一般に想定されることも加わり、他の学問分野にも増して、外的妥当性の問題に関する議論がより活発に続けられてきた。議論の主題は、以前においては、学生の参加者の判断・意思決定は、専門家や社会人のそれ(ら)に代替しうるかであり、本節の冒頭で述べたように、実験の結果の一般化可能性が問われてきたのである。これと関連して、最近では、商業会社に実験参加者の募集を委託する、いわゆるオンライン労働市場の利用が増大している(Brandon et al., 2014)。本小節では、オンライン労働市場の利用に関する議論を通じて、実験会計研究の未来を考える。

オンライン労働市場の利用が実験研究に与えるメリットとしては、低コストで、迅速に、大量のかつ多様な参加者層に対して研究者がアクセスできるようになることであろう。実際に、たとえばLipe(2018, 18)は、オンライン労働市場の登場により、財務会計の実験研究が増加傾向にあると指摘している。その反面、研究者による実験の統制(コントロール)の難しさからもたらされる、新たな外的妥当性の問題が勃発しているかもしれない。すなわち、オンライン労働市場を研究目的で利用する場合、参加者の知識・経験に加え、実験のタスクに取り組むさいのモチベーションの問題も考慮しなければならないのである。このとき、知識・経験については、オンライン労働市場を提供する商業会社に参加者の属性のスクリーニングを依頼できるかもしれないものの、参加する「労働者」がコンピュータ画面に向かい懸命にタスクに取り組んでくれているかどうかは、確認が難しい事項かもしれない。

上記の疑問に対応して、実験会計研究におけるオンライン労働者の利用が会計学の論点の検証にとって適切であるかを問うべく、二つの研究が最近になり実施されている。

第一に、Farrell et al.(2017)は、自身の先行研究に加え、他の研究者らが以前になした研究のデザインを用いた複数の実験セッションを実施し、学生とオンライン労働者との判断・意思決定を比較している。実験データの分析の結果、彼女たちは、オンライン労働者の知識、正直さや努力の水準は、学生参加者のものと大きな差がなかったため、「オンライン労働者は、非熟練者の決定を調査する会計学研究の適切な代替でありうる」(Ibid., 109)と結論付ける。

第二に、Owens and Hawkins(2019)は、学生(M.B.A. students)と相応の知識・経験のある投資家とは代替可能かを調査したElliott et al.(2007)による実験デザインを援用し、オンライン労働者を提供する二つの商業会社、AMT(Amazon Mechanical Turk)とQualtricsの結果を比較検証する。先にみたFarrell et al.(2017)が学生とオンライン労働者との比較であったのに対し、二つの商業会社のオンライン労働者それぞれの判断・意思決定についてベンチマークとなる先行研究の結果と比較したのである。Owens and Hawkins(2019)の比較検証の結果は、AMT(Amazon Mechanical Turk)のオンライン労働者であれば、Elliott et al.(2007)における相応の知識・経験のある投資家と代替しうる可能性、すなわち知識、実験マテリアルの読解、情報の再生・獲得・統合などに関して大きな差がないこと示唆するものであった。

ここでも強調しておかねばならないが、オンライン労働者の利用の問題についても、実験会計研究に限定されるものではない。しかし、筆者らが実験研究を開始した2000年前後と比べて募集環境が大きく変化するなか、会計学の論点の検証にとって適切な参加者(層)へのアクセスを可能とするオンライン労働市場の利用は、一長一短があるのは当然としても、さきのFarrell et al.(2017)の表現を借りるならば、まさに希望の星(stars)であるかもしれない。このため、実験会計研究におけるオンライン労働者の利用の適切性は、今後も継続的に検証されなければならない論点といえる。研究目的にとって関心のある利害関係者(層)と代替でき、よって一般化可能性が高いかどうかという外的妥当性の問題は、引き続き第一の論点となる。これに加え、実験研究の方法論のもう一つの重要事項である内的妥当性にかかわる統制(コントロール)の水準の確保も考慮すべきであるし、商業会社の利用に関連する諸問題、たとえばサービスの特性や会社自体のインセンティブなども考えていく必要がある。オンライン労働者の利用は、欧米では既に定着した研究実践であり、実験研究者各自がどのように付き合っていくのかが問われている段階にあるといえよう。

4.  外的妥当性へのチャレンジ

本節では、前節までの議論を踏まえ、最新の研究プラットフォームとして期待のかかるアマゾン・メカニカル・ターク(Amazon Mechanical Turk:以下AMT)などを使用したオンライン実験の動向や、リーダビリティ実験と将来の実験会計研究の発展可能性など、外的妥当性を高めることにチャレンジしている最新の実験会計研究や、実験会計研究の将来について概観する。

4.1  オンライン実験の動向

行動会計の分野では、2000年代以降、オンラインを用いた質問票調査(オンライン・サーベイ、オンライン・アンケート調査)や、オンラインを用いた実験研究(オンライン実験)など、オンラインを用いた研究が右肩上がりに増加している。行動会計研究が掲載されている主要な学術誌の論文数の推移を確認すると、2000年に公刊されたオンライン研究は、わずか2篇であったが、2012年には24篇もの論文が公刊されている(Brandon et al., 20145。2000年から2012年における公刊されたオンライン研究の総数は115篇であり、その内訳は、質問票調査研究が52篇、実験研究が63篇となっている(Brandon et al., 2014)。以下では、実験研究に焦点を当て、オンライン実験の動向を示す。

オンライン実験研究に使用されているツールは、北米ではSurveyMonkey Audience(以下SMA)、Qualtrics、そして冒頭に紹介したAMTの3つの商業サービスが一般的に使用されている。また、日本ではYahoo!クラウドソーシングが使用されている(後藤, 2018廣瀬・後藤, 2019)。これらのサービスが提供される以前は、実験者は、自らHTMLやJavaなどのプログラミングの知識を習得する必要があったため、オンライン実験研究への参入障壁は高かった。しかし、2000年頃から普及したこれらの商業サービスを使用することによって、複雑なプログラミングの知識は不要となり、直感的な操作でオンライン実験を設計することが可能になった。さらに、被験者の視点においても、パソコンのみならず、スマートフォンやタブレットでもオンライン実験に参加することが可能になったため、これらのデバイスが普及した今世紀は、オンライン実験に対する参入障壁は以前に比べて格段に下がっているといえるだろう。

それぞれの商業サービスには長所・短所があることから、行動会計研究者にとって重要な判断基準となる「コスト」、「柔軟性」、「関心のある集団へのアクセス可能性」という3点について検討する。

まず、「コスト」について検討する。ここでいうコストとは、被験者を募集するための経済的費用を意味する。一般的な実験室実験(ラボ実験)の場合、被験者に対して支払う謝金がコストとなる。オンライン実験の場合でも、被験者に対して謝金を支払うことが一般的であるが、被験者への謝金に加え、商業サービスを使用する手数料が別途必要となる。SMAは1レスポンス当たり1ドルで使用できる。Qualtricsは、SMAやAMTよりもコストが高くなる。そして、AMTは最も新しいサービスであり、2019年10月現在、3つの商業サービスの中で最も低いコストで実験を実施することが可能になっている。Yahoo!クラウドソーシングは1タスク当たり10円から40円、最低使用料金が1,000円であることから、AMTと同程度の水準のコストでオンライン実験を実施することが可能になっている。

次に、「柔軟性」について検討する。ここでいう柔軟性とは、実験者がどの程度自由に実験を設計できるのかということを意味する。具体的には、謝金をいくら支払うことができるのかというインセンティブの程度や、どのような種類の質問項目を実験に含めることができるのかという各社が提供するサービスをカスタマイズできる程度などである。SMAはインセンティブとして0.5ドルの寄付や100ドルのギフト券などを設定することができる。また、SMAは質問項目として操作チェックを含めることができ、それによって回答データの品質を担保している。Qualtricsもインセンティブを設定することができる。インセンティブを設定する際は、Qualtricsの担当者のアドバイスを参考にして実験者が決定する。また、担当者は、実験中に監視を行ない、極端に回答時間が短い被験者、操作チェックに失格した被験者などを特定するという役割を担う。Qualtricsも操作チェックを含めることができる。AMTもインセンティブを設定することができる。ただし、AMTはインセンティブの設定に全面的な裁量を認めているという点に特徴がある。AMTはSMAやQualtricsとリンクさせることが可能であることから、AMTで被験者を募集してSMAやQualtricsで回答してもらうという柔軟な使い方ができる。さらに近年では、AMTで被験者を募集してoTreeで実験を実施することも可能であり、SMAやQualtricsではできなかった相互作用ありの実験を実施できる環境が整っている(Chen et al., 2016)。Yahoo! クラウドソーシングもインセンティブを設定することができる。報酬はカルチュア・コンビニエンス・クラブが運営するTポイントで支払う必要がある。報酬の金額はYahoo! クラウドソーシングに掲載されている他のタスクの相場観を参考に実験者が設定する。Yahoo! クラウドソーシングにおいてもYahoo! クラウドソーシングで被験者を募集したうえで、oTreeで相互作用ありの実験を実施することが可能な環境が整っている。

最後に、「関心のある集団へのアクセス可能性」について検討する。これは、実験者が研究目的に応じて募集したい属性の被験者を募ることができる程度を意味する。SMA、Qualtrics、AMTの3つの商業サービスは、北米を拠点とする企業が提供しているサービスであり、英語を使用言語とする被験者を募集したい場合に適している。SMAは2011年に、Qualtricsは2018年に日本でのサービスを開始した。AMTも2017年から日本で使用できるようになったが、2019年10月現在では、日本語を使用言語とするユーザーよりも英語を使用言語とするユーザーの方が多いことから、英語を使用言語とする被験者を募集するのに適したツールである。SMAはターゲット・オーディエンスという機能があり、追加のオプション料金を支払うことによって、募集する被験者の属性である性別、年齢、学歴などを絞ることができる。また、被験者の属性を納税者や陪審員に絞ることによって、税務会計や法廷会計の分野の実験を実施することもできる。Qualtricsは、非常に大規模な被験者プールを持っているため、個人投資家、特定の業界団体、陪審員候補者、特定の業界で雇用されている個人などの被験者を募ることができる。AMTも非常に大規模な登録者数が存在することから、被験者の属性を個人投資家に絞ることなどが可能になっている。Yahoo! クラウドソーシングは、日本企業が提供しているサービスであるため、日本人や日本語使用者の登録者が非常に多いという点が特徴である。したがって、日本語を使用言語とする被験者を対象とした実験を実施する場合に適したサービスであるといえる。

このように、オンライン実験は、各種サービスによって一長一短があるものの、実験室実験と比較して、実験を計画する際の柔軟性はやや低いものの、コストが低く、関心のある集団へのアクセスが容易であるという特徴がある。特に関心のある集団へのアクセスが容易であるという点は、外的妥当性について常に批判を浴びてきた実験会計研究の弱点をカバーすることができることから、オンライン実験は今後もさらに発展していく手法であることが予想される。

4.2  リーダビリティ実験と将来の実験会計研究

オンライン実験の増加およびLi(2008)を嚆矢とするテキスト分析を用いた実証研究の増加に伴い、2010年代以降は、リーダビリティ実験に関する研究が公刊されている。リーダビリティとは、文字情報の難易度や長さなど、どれだけ読みやすいかを示すものである。Li(2008)は、Management’s Discussion and Analysis(MD&A)の文字情報を分析した。MD&A情報は、アニュアル・レポートの中でも相対的に経営者の裁量の余地が大きく、平易に簡潔に記述している企業もあれば、難解に長く記述している企業もある。Li(2008)は、MD&Aの文章の難易度と文章の長さを測定し、利益率が低い企業は読みにくいアニュアル・レポートを作成していること、読みやすいアニュアル・レポートを開示している企業の利益は持続的であることを発見した6。しかし、Li(2008)をはじめとする実証研究では、経営者が難易度を高くすることや長い開示を行なう意図を明らかにすることはできなかった。すなわち、アニュアル・レポートの難易度が高いあるいは長文の開示は、経営者が悪い業績を隠しているのか、それとも、投資家に丁寧に説明しているのかがわからなかったのである。そこで、リーダビリティにかんする実験研究が実施されるようになった。

リーダビリティ実験は、文章の読みやすさや図表などを操作することによって、経営者と投資家の意思決定がどのように変化するのかを検証している。Rennekamp(2012)は、上述のAMTというクラウドソーシング・サービスを用いてリーダビリティの論点を実験した初めての論文であり、AMTで募集した投資家役の一般人に、ケースを読んで株式を評価してもらうという実験が実施された。Rennekamp(2012)は、被験者の属性を投資経験のある個人投資家に絞っており、これまで実施されてきたMBA学生や学部学生を対象とした実験室実験とは異なり、外的妥当性にチャレンジしたという意味においてオンライン実験の発展可能性を示すものであった。Rennekamp(2012)以後は、リーダビリティとトーンの検証(Tan et al., 2014)、経営者が開示する情報以外の外部情報源の影響の検証(Asay et al., 2016)、Fog Indexに替わるBog Indexの検証(Bonsall et al., 2017)、マネジャーの意思決定(Asay et al., 2018a)、人称代名詞と写真の影響(Asay et al., 2018b)などの実験が行なわれている。これらの研究では、会計情報利用者にとって理解可能性が高いディスクロージャーは何かという点を明らかにしようとしている。これまでのところ、英語圏以外ではリーダビリティの実験は実施されていないことから、今後は日本語圏などでもリーダビリティ実験が実施される可能性があり、将来的にはオンライン実験を駆使することにより、リアルタイムでの国際比較実験も可能になるであろう。

4.3  相互作用のあるオンライン実験の可能性

オンライン実験会計研究の将来の展望として、相互作用のあるオンライン実験を行なう必要があるが、世界的にいまだ実施されていないというのが現状である。伝統的な実験室実験(いわゆるラボ実験)では、1人意思決定実験のほか、複数人の被験者の間に相互作用のある実験も行なわれてきた。相互作用のある実験は、ある被験者の意思決定が他の被験者の意思決定に影響を及ぼす状況を作り出すために、同じ時間に複数人を集める必要がある。そのため、オンライン上で被験者を同じ時間に集めることが難しいことから、2019年10月現在、筆者が知り得る限りでは、会計学では相互作用のあるオンライン実験研究は公刊されていない。このように、会計学におけるオンライン実験では1人意思決定実験が主流であるが、経済学では、すでに相互作用のあるオンライン実験が行なわれている。これを実現するオンライン実験システムであるoTree7は、Pythonで実装されており、1人意思決定実験に加え、相互作用のある実験も設計することができる。従来の実験室実験では、z-Treeで実験を設計することが主流であったが、z-Tree独自のプログラミングを習得する必要があった(Fischbacher, 2007)。しかし、oTreeはPythonで実装されていることから、オブジェクト指向言語に馴染みがあれば、実験を設計することはz-Treeほど複雑ではないという特徴がある。さらに、z-TreeよりもoTreeの方がUI/UX8が高いことから、実験設計者にとっても、被験者にとっても、ストレス無く実験が実施されるという利点がある。また、z-Treeは、実験者も被験者もWindowsのPCを使用する必要があったことから、MacユーザーやLinuxユーザーにとっては不便であった。しかし、oTreeは、OSの環境に依存しないという利点があり、Windows、Mac、Linuxのいずれであっても実験を設計することができる。被験者側も、どのコンピュータを使っても実験に参加することができ、タブレットやスマートフォンからでも実験に参加することができるという利点がある。このように、以前の環境と比較し、実験者がより実験を設計しやすくなったこと、被験者がより実験に参加しやすくなったことから、実験研究への参入障壁は下がり、裾野も広がったといえるだろう。

本節のような背景を踏まえると、近い将来、会計学においても相互作用のあるオンライン実験が主流となることが予想される。

5.  まとめと展望

5.1  本稿のまとめ

以上のように、本稿では実験会計学の未来について、まず3つのキーワード、すなわち「未来志向」、「因果関係」、「総力戦」の視点から展望を示した。事前検証性という特質をもつ実験研究は、社会をより良くするために未来をデザインすることを可能にし(未来志向)、また実験は「反実仮想」を作り上げることができるため、より強いエビデンスレベルの因果関係を捉えることができ(因果関係)、共通言語としてのゲーム理論と実験を用いることで、ひとたび現実の経済現象の抽象化ができれば、この共通言語を話す多くの研究者が一緒にその問題に取り組むことができる(総力戦)という利点を持ち合わせていることを示した。

一方で、実験研究には「再現性」の問題が課題となっていたことも事実であった。原論文をもとに追試しようとしても、論文の記述からは同様の研究手続が実施できないという、研究過程の透明性の欠如が大きな問題とされ、再現性のない実験研究が多く存在していたのである。この問題に対して、実験の研究過程の詳細を事前に決め公開する事前登録制度(プレレジ)が注目を集めている。これにより、第三者の追試に関する透明性の問題や研究不正や疑わしい研究実践(QRPs)に関わる問題を解決されると期待されているからだ。会計学領域のトップジャーナルの一つであるJournal of Accounting Research誌は、査読付き事前登録制度(レジレポ)を採用した号を刊行するなど、その動向は会計領域にも広がりつつあることを示した。

実験研究はまた、「外的妥当性」についての課題も存在している。統制された環境で行われる実験研究の手法の性格により、これまで「内的妥当性」についてはそれなりの水準をクリアできていたともいえる。しかし実験結果を一般化できるかどうかという「外的妥当性」の問題については、物理的・時間的・金銭的な理由から被験者を幅広く大量に集められないという実験上の制約があったために、長らくよい対処法が存在しなかった。ところが近年では、AMT、SMA、Qualtricsといったオンライン実験を実施するためのプラットフォームが提供され始めるようになり、またオンライン労働市場により実験参加者を幅広くかつ安価に調達することが可能となったため、物理的・時間的・金銭的な制約が取り払われようとしており、外的妥当性の問題について、徐々にではあるが解消しつつある現在の状況を明らかにした。さらにoTreeのような実験フレームワークが登場し、複数人による戦略ゲームをオンライン実験でも可能となっていることから、相互作用のあるオンライン実験が今後主流になっていくであろうとの展望を示した。

5.2  実験会計研究の展望

これらの実験会計学の動向を注意深く観察してみると、実験会計研究という特殊な領域だけでなく、会計学領域全般に対する示唆も見えてくる。たとえば実験の再現性の問題で採り上げたp-hackingやHARKingについては、大きな難題を会計領域の研究者に対し、とりわけ現在の主流となっている実証会計の研究者に対して投げかけているといえるだろう。Nature誌では、かつて「心理学の学術誌がp値の使用を禁止―結果の信頼性の検定を『あまりにも簡単にパスしてしまうから』とエディタが語る」と題する記事で、心理学領域の学術誌Basic and Applied Social Psychologyのエディタが、「p値が載った論文は今後掲載されることはないだろう」と語ったことを伝えていたが(Woolston, 2015)、最近でも、同じくNature誌において「統計的有意性というものを捨て去ることを話す時だ」と題する800人もの科学者が署名した記事が掲載されたが(Editorial, 2019)、5つの論文誌に掲載された791文献を調査したところ、51%が統計を間違って解釈していたことが判明したという。

実はこのような論争は、今に始まったことではない。たとえばWildlife Ecology & Management誌に掲載されたダグラス・ジョンソン(Douglas H. Johnson)による「統計的有意性検定の無意味さ」(Johnson, 1999)と題する論文が学会賞を受賞しているし、それを遡ること30年ほど前にも『有意性検定論争』(Morrison & Henkel eds., 1970)という本が出版されており、半世紀近く前から同様の問題点が指摘され続けていたのである(坂上, 2016)。Nature誌が立て続けにこのような動きを見せたことにより、早晩p-hackingやHARKingの問題は経済学領域にも波及するであろうし、やがては会計学領域にも波及するに違いない。

実験会計研究者は、心理学領域の実験研究を通じて研究不正や疑わしい研究実践(QRPs)の問題にいち早く気が付いており、このような誤用から早く離れることができるのではないかと思っている。このような新たな研究動向について、「総力戦」で臨んでいる実験会計研究は、ある意味で他の会計学領域よりも先行しているといえる。実験会計研究は時代を先取りしているのである。

時代を先取りしているという点では、AI研究の進展と実験研究への応用についても、触れておく必要があるだろう。たとえばAIによる不正探知は、継続監査(Continuous Audit)とも繋がるが、これは取引の都度、仕訳データをAIで取り込みタイムリーにモニタリングがなされるもので、これからの新しい時代の監査として注目を集めている。Gonzalez and Hoffman(2018)は、実験経済学的手法を用いてこの効果を検証しているが、①不正探知システムが頑健である場合はタイムリーさに関係はない(逆に言えば、継続監査のメリットはない)が、②不正探知システムが脆弱である場合には、タイムリーなモニタリングが逆に被験者の不正の機会の認知を増加させ、実際の不正行動を高めてしまうという衝撃の結果を明らかにしている。これは、継続監査が会計不正を減らすのではないかという社会の期待に反する意図せざる帰結であるし、不正探知力が相対的に弱い状況のもとでAIを利用した継続監査をおこなうと、不正が逆に増加してしまうという予測ができてしまう。これは未来の会計利益が抱える「フューチャー・ハザード」にほかならない(田口, 2019a)。

昨今、ディープラーニングに代表されるAIの進展に呼応して新たな展開を模索する研究が登場しているが(坂上, 2017)、このように実験会計研究では、その応用の仕方と結論がひと味違う。AIを応用した研究の多くは、業務を改善したり、検証精度を改善したり、不正検知への応用は不正の減少をもたらすかもしれないといった、明るいバラ色の未来を描くものが少なくない。しかしながらGonzalez and Hoffman(2018)は、より複雑でより深刻な問題を浮かび上がらせたといえる。これは未来の会計で起こりうる状況について、実験室で予測することができる実験研究だからこそ、うかがい知ることができたといえるのではないだろうか。

近年において、実験会計研究者をネットワーク化する動きも見られるようになっている。たとえばヨーロッパにおいて、ヨーロッパ実験会計研究ネットワーク(European Network for Experimental Accounting Research: ENEAR)が創設され、年に2~3回のカンファレンスを開催しており、その際には博士課程の学生へのチュートリアル・コロキアムも開催して新たな研究者の育成もおこなっている。日本においてもDEAR(Doshisha Experimental Accounting and Finance Research)という研究会(https://sites.google.com/view/staguchi/dear)において、実験会計研究に関する多くの共同研究成果が生まれている。実験会計研究の未来には、ブルー・オーシャンが広がっており、取り組むべき課題は無数に存在しているといっても過言ではない。このような機会を通じてより多くの研究者がこの領域に参入し、新たな会計研究の未来を切り開いていくことを期待したい。

1  本稿は会計学における実験研究の未来について語ることにあるため、これまでの動向については割愛しているが、初期の実験会計学に関するサーベイ論文としては上枝(2007)を参照されたい。

2  会計やファイナンス研究を巡る近年のフィールド実験の動向については、たとえば、Floyd and List(2016)などを参照されたい。

3  会計研究における実験研究の将来性については、Bloomfield, Nelson, and Soltes(2016)によるサーベイのほか、Bonner(2008)田口(2012, 2015, 2019b)を参照されたい。

4  実験経済学の学会(Economic Science Association: ESA)では、機関誌であるJournal of the Economic Science Association誌において再現実験論文(replication papers)を掲載するセクションを設けるようになっていることからも、社会科学領域における実験研究の再現可能性が問われていることの証左であろう。

5  Brandon et al.(2014)が調査対象とした学術誌は、北米系の高品質な学術誌のうち、行動会計の論文が掲載されている次の13誌である。Accounting Horizons、Accounting, Organizations and Society、The Accounting Review、Advances in Accounting、Auditing: A Journal of Practice & Theory、Behavioral Research in Accounting、Contemporary Accounting Research、Issues in Accounting Education、Journal of Accounting Research、The Journal of the American Taxation Association、Journal of Emerging Technologies in Accounting、Journal of Information Systems、Journal of Managerial Accounting Research。したがって、行動会計の全ての論文を調査対象としているわけではない点に留意する必要がある。

6  なお、MD&Aが読みにくくなってきている米国とは対称的に、日本のMD&Aは読みやすくなってきている(廣瀬・平井・新井, 2017)。

7  oTreeとは、複数人による戦略ゲーム(囚人のジレンマ、公共財ゲーム、オークション等)を実施したり、経済学や心理学等の領域において統制された行動実験を実施したり、サーベイやミニテスト(quizzes)を実施したりすることのできるPythonベースのフレームワークのことで、http://www.otree.org/がそのホームページである。oTreeに関する最新情報(英語)は、https://otree.readthedocs.io/en/latest/等で入手することができる。また明治大学の後藤晶氏はoTreeを使った経済実験環境ライブラリを公開しているので、参照されたい(http://open.bee-lab.online/demo/)。

8  UIとはUser Interfaceの略であり、UXとはUser Experienceの略である。画面デザインやプログラムの入手からインストールするまでの手間、実際の使い勝手、等々を表す用語である。

参考文献
 
© 2020 法政大学イノベーション・マネジメント研究センター
feedback
Top