Article ID: 96.24304
This study aimed to investigate differences in responses between groups by comparing online responses via smartphones using various response formats on Google Forms with responses from paper questionnaires among university students. Participants were randomly assigned to either an online group where they responded using one of grid, radio button, or linear scale formats, or a paper-based group. In each group, respondents answered multiple psychological scales and rated the visibility of the survey form. Additionally, response times and the ratio of careless responses were recorded. A total of 1,108 valid responses were analyzed. Results indicated that in the grid group, certain mean values of scale scores and some correlation coefficients differed from those in the paper-based group. Furthermore, there were more careless responses, longer response times, and lower ratings for form visibility in the grid group. Differences in mean values for some scales compared to the paper-based group were also observed in the linear scale group. The radio button group showed the least difference in responses compared to the paper-based group.
心理学の研究において,オンラインでのアンケートを用いた調査(以下,オンライン調査とする)は近年増加している(三浦・小林,2018)。オンライン調査は,データ収集が容易であることに加え,回答の分岐を設定しやすく,回答漏れがあった際に注意メッセージを表示できるなど(Zhang et al., 2012),実施上の利点を多く持つ。
では,オンライン調査は紙を用いた従来の質問紙調査と同等の結果をもたらすのであろうか。オンライン調査が用いられるようになった初期の研究では,オンライン調査を行った場合でも,紙による調査と同様の結果が得られるとされてきた(Krantz et al., 1997; Krantz & Dalal, 2000)。しかし,情報技術の発達により,オンライン調査の在り方はより多様化していると思われる。当初のオンライン調査はパーソナルコンピューター(PC)を用いて回答するものであったが,2007年のAppleによるiPhone発表以降,高機能なモバイル端末は広く普及し,多様なデバイスを用いた調査が行われるようになっている。例えば,日本における大学生を対象とした調査の場合,慣例的に授業時間中に調査を実施することが多いが,このような場合,回答にスマートフォンが用いられていることも少なくないと考えられる。
PCとタブレット,スマートフォンなどのデバイス間で回答を比較した調査では,デバイスの違いによる顕著な差はないことが報告されている(Tourangeau et al., 2017; 山田・江利川,2023)。オンライン調査と紙の調査を比較したレビューでも,スマートフォンやタブレットを用いた調査と紙の質問紙を用いた調査とで,ほぼ同等のデータが得られるとされている(Marcano Belisario et al., 2015)。しかしこのレビューでは,オンラインの回答フォームのデザインによる影響が検討されていない点が重要な課題として挙げられている。
回答フォームのデザインにおける課題には大きく2つの側面がある。第1は用いる回答形式である。オンライン調査の画面を設計する場合,1つの設問とその設問への回答選択肢のセットを単位としたラジオボタンのような形式や,設問を縦に,回答選択肢を横に並べてマトリックスで配置したグリッドなど,さまざまな形式が存在する。第2は,より細かな画面上のデザインである。オンライン調査を行う先行研究の多くは,回答画面を独自にデザインしている(例えば,Zhang et al., 2012)。そのため,同じラジオボタン形式を用いる場合でも,研究によってそのレイアウトの詳細が異なるという問題が生じる。
日本国内の研究では,回答形式にスライダーを用いると,ラジオボタンに比べて回答時間が長くなること(山田,2020)や,選択肢が縦に配列されるか横に配列されるかによる違いはないが,肯定的な選択肢を先に提示する場合,後に提示する場合よりも,肯定的な選択肢が選択されやすいことが報告されている(住本,2008)。また,グリッドは紙の質問紙のレイアウトに近い表示が可能であり,回答者には見慣れた形式であると想定されるものの,画面内に提示される情報量が多くなり,回答者の注意を低下させる可能性が指摘されている(眞嶋・中村,2022)。
しかし,回答フォームのデザインによる回答への影響は,日本ではあまり注目されておらず(増田,2019),研究の数自体はわずかである。いずれの研究も,紙とオンラインの比較は行われておらず,調査内容についても,1つか2つ程度の心理尺度(眞嶋・中村,2022)か,数項目の質問(住本,2008; 山田,2020)など,限定的である。加えて,研究ごとに回答者の属性や用いる端末の種類が異なるため,研究結果の一般化は現時点では不可能に近いと指摘されている(山田,2020)。
結果の一般化の困難性の問題は,研究数の多い海外でも同様である。DeCastellarnau(2018)は,回答フォームのデザインによる比較を扱う140の研究をレビューした。その結果,デザインによる違いは存在する可能性が示唆されるものの,影響が考えられる要素自体が多岐にわたる上に,結果の混在が非常に多く,依然として多くの課題が存在するとしている。
以上のような課題を踏まえると,オンライン調査と紙の調査との違いを明らかにするためには,比較する要素を限定し,明示した上で,知見を蓄積していく必要があると考えられる。
本研究の目的オンライン調査と紙の調査との違いを検討する際は,研究者間で共有可能なツールを用いてオンライン調査のフォームを作成する必要があると考えられる。近年では,2014年に発表されたGoogleによるGoogle Formsや,2016年に発表されたMicrosoftによるMicrosoft Forms(発表当初はOffice Forms)をはじめ,簡易かつ安価に利用可能なオンライン調査のツールが存在する。これらのツールは,あらかじめ用意されたオプションを選択しながら,オンライン調査のフォームを作成・編集することができ,html等の知識がなくともオンライン調査の実施を可能にする。特にGoogle Formsは無料で利用することができ,教育場面で調査法を学ぶためのツールとしても推奨されている(豊田,2015)。こうしたツールを用いることで研究間での比較可能性を高めることが可能である。
以上から本研究は,Google Formsの複数の回答形式を用い,スマートフォンを用いたオンラインでの回答と,紙による質問紙での回答の比較を通して,回答の群間差を検討することを目的とする。調査の場面は,大学生を対象とした授業時間内でのスマートフォンを用いた調査とする。また,調査では回答法にリッカート形式,順序形式,名義形式を含む複数の尺度を用いる。検討の観点としては,尺度得点の平均値やα係数,尺度得点間の関連など,心理尺度を用いて行う一般的な分析の結果に加え,分析に使用可能な有効回答の比率,回答者にとっての回答しやすさの3点を扱う。有効回答の比率には,不注意な回答を除外するための「この項目は●を選択してください」という形式の項目であるInstructed Response Items(IRI; Ward & Meade, 2023)1を用いる。回答しやすさには,質問紙,調査画面の見やすさに対する回答者の主観的評価を用いる。また,オンラインの回答では回答時刻の取得が可能であることから,回答時間も回答のしやすさの指標として用いる。なお,オンライン調査では回答必須設定をすることで回答漏れを防ぐことができるという利点があり(Zhang et al., 2012),多くの調査でも回答必須の設定がなされていることが想定される。本研究でも,一般的な調査場面に条件を近づけるため,回答必須の設定を行い,調査を行う。
2023年1―4月に,関東・中部地方の4年制私立大学において,授業時間内に調査を実施した。研究は,立正大学大学院心理学研究科研究倫理委員会の承認を得た(承認番号:22004)。調査の際は,調査への参加は任意であり,不参加や回答の中断による不利益は一切ないこと,調査は匿名で実施され,個人が特定されることはないことが説明され,質問紙の配付完了後に各回答者が一斉に回答を始めるよう指示した。なお,スマートフォンを所持していない回答者は申告するよう教示したが,そのような申告はなく,合計で1,185名から回答を得た。
調査内容心理尺度 尺度には,信頼性・妥当性が報告されている,逆転項目を含む,ある程度使用実績があるという点を基準に,回答法の異なる4つの尺度を選定した(Table S1参照)。具体的には「あてはまらない―あてはまる」のように,両極のリッカート形式で回答する尺度として,7件法のBig Five尺度短縮版(並川他,2012),5件法の自尊感情尺度(山本他,1982)に加え,「全くないか,あったとしても,1日も続かない―週のうち5日以上ある」のように単極の順序形式4件法で回答するうつ病自己評価尺度(CES-D; Radloff, 1977)の日本語版(島他,1985),「はい―いいえ」の名義形式で回答する一般性セルフ・エフィカシー尺度(GSES; 坂野・東條,1986)を用いた。
その他の指標 4つの尺度それぞれにIRIを1つ設定し,教示通りの選択肢を選択しない項目が1つでもあった回答者(IRI違反者)の回答を無効とした。画面の見やすさについては,回答画面(P群は回答用紙)の見やすさを7件法で尋ねた。加えて,オンラインで回答する群では回答時間も分析に用いた。Google Formsでは回答を提出した時刻が記録されるため,調査を実施した授業における最初の回答提出者を基準とし,以降の各回答者が,何秒後に回答を提出したかを,回答時間の指標とした。
基本属性 回答者の性別(女性・男性・その他),年齢,学年を尋ねた。
質問紙・回答フォームの構成と調査手続き使用した回答形式 オンラインの調査では,Google Formsにデフォルトで搭載されている択一式の回答形式であるグリッド,ラジオボタン,均等目盛を用いた(Figure S1参照)。ラジオボタンは,質問項目の下に各選択肢が縦に配置される形式である。均等目盛は,ラジオボタンと同様,質問項目の下に各選択肢が縦に配置されるが,選択肢のラベルは両極のみ表示され,それ以外の選択肢には数値のみが記載される2。グリッドは,質問項目が左端の列に縦に配置され,回答の選択肢が横に配置されたマトリックスで表示される形式である。紙の質問紙調査における質問項目と選択肢は,質問紙調査において一般的と考えられるグリッドの形式で配置した。
いずれの形式においても,設問に最も近い位置に否定的な選択肢が,最も遠い位置に肯定的な選択肢が表示されるよう設定した。すなわちラジオボタンと均等目盛においては,上部に否定的な選択肢,下部に肯定的な選択肢が表示された。グリッドと紙の調査においては左側に否定的な選択肢,右側に肯定的な選択肢が表示された。教示文はいずれの群も同様であるが,均等目盛のみ設問での全ての選択肢に記述が表示されるわけではないことから,教示の部分に選択肢の記述を記載した。
画面表示の確認 調査画面がスマートフォン上でどのように表示されるか確認するため,2020―2022年における日本のスマートフォンのシェア上位3社(Apple, Sony, Samsung)が同期間内で発表した機種のうち,画面サイズが最小のもの(Apple iPhone SE第2世代など,1334×750pixel)と最大のもの(Sony Xperia 1 IIなど,3840×1644pixel)を選出した。続いて,Google Chromeの開発者ツール機能を用いて,最小の画面サイズと最大の画面サイズの表示の違いを確認した。その結果,ラジオボタンと均等目盛の場合は,いずれのサイズでも設問とそれに対応する選択肢が全て1画面内で表示されていた。一方グリッドは,1画面内に複数の設問を表示可能であるものの,一度に表示可能な選択肢は5つ前後であり,それ以上の選択肢を表示させるには,画面を右にスワイプさせる必要があった。
調査手続き 調査では紙,グリッド,ラジオボタン,均等目盛の4群を設定した(以下,それぞれP群,G群,R群,L群とする)。また,尺度の提示順を考慮するため,使用する4つの尺度について提示順の異なる24パターンを設定した。4群×24パターンの計96種類の質問紙を用意し,各回答者はいずれかの質問紙をランダムで受け取った。いずれの群においても,まず4つの尺度に回答した後,性別(女性,男性,その他,答えたくない),年齢,学年などの基本属性に加え,画面の見やすさについて尋ねる質問に回答した。回答の管理のため,質問紙の表紙には通し番号を付した。
P群では,フェイスシートに続いて1ページごとに1つの尺度を記載し,最終ページに基本属性と画面の見やすさについて尋ねる質問を記載した。一方,スマートフォンを用いるG群,R群,L群では,フェイスシートの次のページに,Google Formsへのリンクを設定したQRコードを記載し,回答者にはスマートフォンでQRコードを読み取った上で回答するよう求めた。
Google Formsでは4つの尺度が順次提示された。回答者が全ての尺度に回答した後,「ここで一度,配布した質問紙に戻り,QRコードのあるページの次のページの質問に回答してください」という教示が画面上に表示され,質問紙上のQRコードのあるページの次のページの質問に回答するよう求めた。QRコードのあるページの次のページは,P群における最終ページと同様の形式・レイアウトで記載されており,回答者は基本属性と画面の見やすさを尋ねる質問に回答した。ただしP群と異なる点として,ページの最下部には再度スマートフォンの画面に戻るよう指示を記載した。スマートフォンの画面には,オンラインの回答と質問紙の照合のため,質問紙の表紙にある通し番号を入力するよう表示し,番号を入力すると回答は完了となるよう設定した。なお,Google Forms上の全ての質問は回答必須に設定した。
分析方法分析にはIRI違反のない者の回答を有効回答とした。まず,有効回答者の属性が群間で偏りがないことを確認するために,年齢と学年について分散分析,男女比についてχ2検定を行った。
また,P群においては欠損値が発生したため,回帰代入法を用いた欠損値の補ていを行った。回帰代入法などの単一代入法は,得点分布の偏りを生むため,積極的に推奨される方法ではないが,欠損値の割合が5%未満であれば大きな偏りは生じないことが明らかになっている(Schafer, 1999)。本研究では,P群の有効回答者の中で欠損値のある者は3.4%(10名)に留まり,いずれの回答者も欠損値は1つのみであった。また,欠損値のあった項目は回答者間で全て異なっていたことから,単一代入法による得点の偏りは大きな問題をもたらさないと判断した。そこで,回帰代入法で得られた値の小数点以下第一を四捨五入した整数を,補てい値として使用した。
続いて,各項目の得点の合計を項目数で除算した値を尺度得点とし,各得点のα係数と平均値に加え,得点間の相関について,群間差を検討した。α係数の差は,独立した複数のα係数の差の検定(Feldt et al., 1987)を行った。また,平均値の差の検定については1要因分散分析を行い,多重比較にはTukey HSD法を用いた。相関係数の差は,Weaver & Wuensch(2013)の方法に基づき,Qの算出による等質性の検定を行い,Qが有意である場合は,Holm法による有意水準の調整を行った上で各相関係数同士の差の検定を行った。最後にその他の指標として,IRI違反者の比率の差,回答のしやすさと回答時間の平均値差を検討した。IRI違反者についてはχ2検定を,回答のしやすさについては1要因分散分析を用いた。回答時間は,データの正規性が確認できなかったため,Box-Cox変換を用いて値を変換し,正規性を確認した上で,回答した授業をダミー変数として共変量に用いた共分散分析を行った3。ただし,回答時間が20分を超えた者については,教室退室後の任意のタイミングで回答が提出されたと判断し,分析からは除外した。
基本的な分析にはIBM SPSS Statistics version 22.0を用い,信頼性係数の差の検定はRのcocronパッケージ(Diedenhofen & Musch, 2016)を用いた。
調査の有効回答者数は1,108名であり,各群の回答者数は262―291名であった。年齢(F (3, 1078) =1.725, p=.160, η2=.005),学年(F (3, 1078) =0.714, p=.544, η2=.002)の平均値や,女性の比率に有意な群間差は見られなかった(χ2 (3) =1.798, p=.615, V=.041)。
群間の比較尺度得点の比較 各尺度のα係数に群間差は見られなかった(χ2 (3) =0.035―5.640, ps=.131―.998; Table S1参照)。平均値の差については,抑うつのみ群の効果が有意であり(F (3, 1104) =5.012, p=.002, η2=.013),多重比較の結果,P群がG群(p=.011)およびL群(p=.022)よりも低かった(Table 1)。
各指標の記述統計量と群間差の分析結果
P群 n=291 |
G群 n=262 |
R群 n=269 |
L群 n=286 |
群間差 | |||||||||||||||||||
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
M | (SD) | M | (SD) | M | (SD) | M | (SD) | 統計量 | p | 効果量 | |||||||||||||
注)p値の有意なものは太字で示した。添え字は,分散分析が有意であった場合の多重比較の結果を表すものであり,同じ添え字がついている数値間の差は有意でない(α≧.05)ことを示す。IRI違反者のみ,統計量としてχ2値,効果量としてVを示す。その他はいずれも統計量はF値,効果量はη2を示す。回答時間は,分析の際はBox-Cox変換した値を用いている。 | |||||||||||||||||||||||
外向性 | 4.36 | (1.31) | 4.20 | (1.32) | 4.28 | (1.34) | 4.33 | (1.34) | 0.822 | .482 | .002 | ||||||||||||
誠実性 | 3.65 | (1.02) | 3.57 | (1.08) | 3.48 | (1.05) | 3.65 | (1.18) | 1.480 | .218 | .004 | ||||||||||||
情緒不安定性 | 5.09 | (1.22) | 5.19 | (1.32) | 5.10 | (1.23) | 5.11 | (1.28) | 0.402 | .752 | .001 | ||||||||||||
開放性 | 3.94 | (1.06) | 3.94 | (1.18) | 3.91 | (1.03) | 3.79 | (1.09) | 1.197 | .310 | .003 | ||||||||||||
調和性 | 4.61 | (1.04) | 4.70 | (1.04) | 4.59 | (1.01) | 4.63 | (1.10) | 0.525 | .665 | .001 | ||||||||||||
自尊感情 | 3.01 | (0.86) | 2.89 | (0.84) | 2.95 | (0.87) | 2.92 | (0.88) | 0.975 | .404 | .003 | ||||||||||||
抑うつ | 0.86 | b | (0.49) | 0.99 | a | (0.54) | 0.88 | ab | (0.48) | 0.98 | a | (0.53) | 5.012 | .002 | .013 | ||||||||
自己効力感 | 1.39 | (0.25) | 1.35 | (0.23) | 1.37 | (0.23) | 1.36 | (0.23) | 1.757 | .154 | .005 | ||||||||||||
その他の指標 | |||||||||||||||||||||||
IRI違反者 | 2.0% | 12.1% | 8.8% | 3.1% | 33.460 | <.001 | .168 | ||||||||||||||||
見やすさ | 5.54 | ab | (1.36) | 2.97 | c | (1.38) | 5.79 | a | (1.28) | 5.44 | b | (1.40) | 243.381 | <.001 | .404 | ||||||||
回答時間 (秒) | - | 208.8 | a | (124.9) | 178.9 | b | (115.5) | 195.9 | b | (118.4) | 8.608 | <.001 | .022 |
相関係数の差 まず,8つの尺度得点同士の相関係数を群別に算出し,各群で得られた28の相関係数について群間差を検討した(Table S3参照)。その結果,28組の相関係数のうち3組で有意差が見られた(Q=8.794―14.929, ps=.002―.032)。情緒不安定性-外向性間ではG群と残る3群との間(ps<.002),情緒不安定性-開放性間ではG群とP,R群との間(ps<.010),情緒不安定性-自己効力感間ではG群とL,R群との間(ps<.004)に有意差が見られ,全てG群の相関係数の絶対値が小さかった。
その他の指標の差 IRI違反者の比率は群間差が見られ(χ2 (3) =33.460, p<.001, V=.168),残差分析の結果,IRI違反者の比率はG群で有意に多く(p<.001),P群(p<.001)とL群(p=.009)で有意に少なかった。見やすさ(F (3, 1075) =243.381, p<.001, η2=.404)と回答時間(F (2, 772) =7.950, p<.001, η2=.020)は群の効果が有意であり,見やすさはG群が他の全ての群よりも低く(ps<.001),加えてR群がL群よりも高かった(p=.016)。回答時間はR群よりもG群(p<.001)とL群(p=.039)が長かった。
IRIの効果についての補足的分析 本研究ではIRI違反者を除外したデータを用いて分析を行ったが,調査によってはIRIを設定できない場合もある。そこで,IRI違反者もデータに含め,改めて同様の分析を行った。その結果,これまでの分析で有意差が見られた指標はいずれも同様に有意であり,加えて,情緒不安定性のα係数(χ2 (3) =9.276, p=.026)と情緒不安定性-調和性間の相関係数(Q (3) =8.338, p=.040)の群間差が有意であった。情緒不安定性のα係数についてはG群が他の群よりも有意に高く,情緒不安定性-調和性間の相関係数については,G群における相関係数が,P群およびR群の相関係数よりも有意に低かった。
本研究の目的は,Google Formsにおける複数の回答形式を用い,スマートフォンを用いたオンラインでの回答と,従来の紙による質問紙での回答の比較を通して,回答形式による回答の差を検討することであった。
分析の結果,α係数については群間差が見られなかったが,その他の指標についてはいくつかの群間差が見られた。特にG群は他の群との間で多くの指標に差が見られた。すなわち,抑うつ得点がP群よりも有意に低く,尺度得点間の相関係数も複数の値がP群と異なっていた。さらに,IRI違反者が有意に多く,見やすさの評価が低く,回答時間がL,R群に比べて長いなど,分析に使用できない回答者の割合や,回答者にとって回答の負担が増す可能性が示された。また,IRI違反者も加えた分析では,さらに情緒不安定性のα係数と情緒不安定性-調和性間の相関係数でも,G群と他の群との間に有意差が見られた4。
G群は,表示の形式こそ紙の調査と似ているものの,選択肢が多い場合は,選択肢を表示させるために画面を横にスワイプさせる必要がある。そのため,設問と選択肢の視認性の問題が回答に影響した可能性がある。視認性による影響の可能性は,1つの画面には1つの設問が表示され(眞嶋・中村,2022),1つの設問に関する情報が全て同一画面上に表示される(De Bruijn & Wijnant, 2014)ことが望ましいという先行研究の知見と一致する。
逆に紙の回答と最も類似した結果が得られたのはR群であった。R群は,G群に比べると画面を縦に移動させる量が増えるが,各設問単位で見た場合,必要な情報が画面内にまとまって表示されるため,回答者にとっては回答しやすい形式である可能性が考えられる。
L群は回答時間がP群よりも長く,抑うつ得点もP群と差が見られた。抑うつの尺度に用いたCES-Dは,選択肢が順序形式となっているため,選択肢の両極のみが表示されるL群では回答が歪む可能性が考えられる。選択肢がリッカート形式の場合はこのような問題は生じにくいと考えられるものの,L群はR群よりも見やすさの評価が低いことから,オンライン調査で均等目盛りを用いる積極的理由はないと考えられる。
見やすさの要因がどのようにして回答の差異につながるのかについては,いくつかのメカニズムが考えられる。まず,回答の負荷の高さによるミスの誘発されやすさがある。均等目盛りやグリッドは,必要な情報が1つの画面内に全ては表示されないため,選択に必要な情報を短期的に記憶に保持する必要が生じる。加えてグリッドの場合,選択肢を表示させるためにスワイプを行わなくてはならない。このような回答の際の負荷の高さによって,回答者が意図した選択を誤りやすくなる可能性がある。次に,回答への動機づけがある。回答への負荷の高い調査は回答への意欲を低下させる(Peytchev, 2009)。そのため,回答負荷の高さが,設問を丁寧に読み選択肢を確認する動機づけを低下させる可能性がある。また,画面をスワイプして画面外の選択肢を選択することが避けられやすくなり,回答が偏る可能性も考えられる。例えばIRI違反の差は,負荷の高さによってミスが誘発されやすくなる可能性と,動機づけの低下によって設問を読み飛ばすようになる可能性の両方が考えられる。一方,得点の平均値の差については,G群でスワイプが必要となるBig Fiveで平均値の群間差は見られていない。そのため,平均値の差は単純にスワイプの必要な選択肢の選択頻度が低下することに由来するわけではなく,別の処理過程の差によるものである可能性が考えられる。そのため,回答フォームの違いによる回答への影響を明らかにするためには,「見やすさ」の要素を整理し,それらがどのような形で影響するのか,詳細に検討する必要がある。
研究の貢献と課題本研究の結果から,オンライン調査を実施する際は,1画面上で設問や選択肢が過不足なく表示されているかなど,回答フォームのデザインにも留意する必要があると考えられる。先行研究では,これまでもグリッドのように1度に多くの項目を提示するのではなく,項目を1つずつ提示する方が良いとする報告はいくつかあるものの(例えば,Couper et al., 2013),必ずしも結果が一貫しているわけではない。特に本研究では,P群もグリッド形式で作成していることから,同じグリッドであっても,紙の調査とオンライン調査で差が見られることが示された。加えて先行研究では,比較する指標が限定的であることや,調査画面が独自に作成されたものであり,研究間の比較に限界があることなどの課題があった。本研究は,Google Formsという広く共有可能なフォームをもとに,回答形式の異なる複数の心理尺度を用い,G群,R群,L群という3つのオンラインの回答形式とP群との間で,分析結果,有効回答の比率,回答のしやすさなど複数の観点から比較をしたという点で,意義のある資料を提供するものであると考えられる。
最後に,本研究の限界と課題について3点述べる。第1に,本研究は特定の尺度を用いて実施されたものであるという点である。例えば相関係数の差は,主にBig Fiveにおける情緒不安定性にかかわるものであったように,今回得られた結果は,選定された尺度固有の特性である可能性もある。第2に,本調査は授業時間内で行われたものであり,有償の公募型調査とは文脈が異なるという点である。本研究の結果を踏まえるならば,オンライン調査を実施する際にグリッドの使用は避けることが望ましいと考えられる。一方,有償の公募型調査は,調査協力者が任意のタイミングで参加できることや,参加に対する報酬が与えられることなど,参加の形式が本研究と異なる部分も多い。そのため,使用する尺度や実施場面の異なる調査においても同様の結果が示されるのか否かについては,更なる検討が必要である。第3に,本研究ではオンライン条件において全ての設問を回答必須に設定しているという点がある。本研究では,一般的な調査場面に条件を近づけるため,回答必須の設定を行った。しかし回答が必須の場合,回答に迷う設問や答えたくない設問でも,何らかの回答をしなくてはならない。そのため,回答必須の設定が質問紙の回答とオンラインの回答との間に差をもたらしている可能性も否定できない。回答が必須ではないP群においても,非回答(欠損値)の出現率は非常に低かったことから,回答必須による実質的な影響は決して大きくはないと想定されるが,基礎的な知見を蓄積するためには,回答必須設定の有無による差や回答の形式による欠損値の出現率の差も今後検討する必要があると考えられる。
本研究に関わる,開示すべき利益相反事項はない。
本研究で用いた回答形式の例はFigure S1として,調査項目,α係数の比較,相関係数の比較の詳細はTable S1―S3として,そして回答時間の扱いについてはSupplementary Informationとして,J-STAGEの電子付録に記載した。
IRIのような形式で有効回答者を選択する手法は,努力の最小限化の文脈ではDirected Questions Scale(DQS)と呼ばれる。努力の最小限化は調査協力者が調査に際して応分の注意資源を割かない行動(Krosnick, 1991)であり,わが国でも浸透している概念である(三浦・小林,2018)。一方,教育評価等の研究では,項目の内容に基づかない反応は不注意な回答(Ward & Meade, 2023)と呼ばれ,IRIもこの不注意な回答を検出する際に用いられるものである。努力の最小限化は,調査協力者の努力不足というニュアンスを含む一方,不注意な回答は,努力不足だけでなく,注意力や文章理解力の不足などさまざまな要因を想定した広い概念である。実際,回答者がIRI(あるいはDQS)に違反したとしても,努力を怠っているのかの判別は困難である。以上のような理由から,本研究で用いる有効回答者の検出方法は,IRIと呼称することにした。
2均等目盛は,スマートフォン上は各選択肢が縦に配置されるが,PCのディスプレイ上では左右に配置される。
3本研究で用いる回答時間は,回答者の総回答時間を表すものではないが,総回答時間に対する群間差の効果を検討する上では使用できると判断し,調査に用いた(詳細はSupplementary Information参照)。
4α係数は,G群(α=.890)のみ他の群(αs=.838―856)よりも値が高かった。本下位尺度の作成時に報告されたα係数は.82であったことから(並川他,2012),G群のα係数は,回答の偏りにより不当に高くなっている可能性が考えられる。