In recent years, the importance of data sharing has been emphasized in psychological research, and systems for data sharing have been developed. However, currently existing methods have not enabled secondary analysis that examines the relationships among variables across multiple data sets. To conduct secondary analysis beyond a single data set, a sharing system is needed to link data from the same individual that exists in multiple data sets. In the current study, we focused on decentralized personal data stores (decentralized PDS) as a sharing system for securely linking data among individuals. We discuss the issues that need to be resolved to popularize decentralized PDS in psychological research and the potential benefits of decentralized PDS becoming more prevalent in psychological research.
近年の心理学領域では,再現性の問題から既存のデータに対して再解析をすることが重要であり,そのためには,他者に対するデータの共有が促進される必要があると指摘されている(国里,2020; Levenstein & Lyle, 2018; Miyakawa, 2020)。実際に,データ共有の必要性は多くの研究者が感じており,Springer Natureが実施した約7,700人の研究者を対象とした調査では,回答者のうち76%がデータ共有をした方が良いと回答したことが報告されている(Stuart et al., 2018)。このように,データ共有の需要が高まる一方で,心理学の研究者を対象とした調査では,どのようにデータ共有をすればよいのかわからないと感じている研究者も数多くいる(Houtkoop et al., 2018)。そこで,現在では,データ共有の取り組みを普及させるために,データ共有の方針やガイドラインがまとめられたり(Goodman et al., 2014; Levenstein & Lyle, 2018),Open Science Framework(OSF; 詳細は,Soderberg(2018)を参照のこと)をはじめとするデータを共有するためのプラットフォームやリポジトリが多数作成されたり(Gilmore et al., 2018; 国里,2020; 三浦,2018),容易にデータ共有をするための枠組みが整いつつある。
データ共有の枠組みが広く普及し,誰もがデータにアクセスできるようになることは,研究知見の再現性を高めること以外にも利点を有している。例えば,共有されたデータを二次利用して従来とは異なる観点で分析をすることで,データを収集することができない場合でも新たな知見を生み出すことができる(Levenstein & Lyle, 2018)。あるいは,複数の研究において共有されているデータを利用することで,個人では収集することの難しい大規模なデータを扱うことも可能となる(Martone et al., 2018)。開他(2019)は,大規模かつ縦断的なデータの測定と分析を行うReal World認知科学を提唱し,その重要性を指摘している。大規模なデータを取り扱うことは,よりリアルな人々の様相や現象を捉えた研究知見を研究協力者,ひいては社会に還元するうえで役立つと考えられる。こうした点から,データ共有を活用することは研究者と研究協力者の双方にとって重要である。
一方で,現状でのデータ共有には限界点もある。それは,データ共有の際に個人を紐づける情報が削除されることで,データの利用可能性が狭まることである。データを共有する際は,不特定多数の研究者に対してデータを開示するため,従来以上にデータを提供した個人が特定されないように注意しなければならない。具体的には,個人が特定されうる情報を取り除く,データ収集をした日時などの特定の値にノイズを追加するなどの方法が対策としてあげられる(Walsh et al., 2018)。しかし,従来の方法では,個人が複数の調査や実験に参加し,異なるデータセット間に同一の個人のデータが含まれていたとしても個人を紐づける情報が取り除かれているため,各データがどの個人のものかが定かではない。つまり,複数のデータセット内に存在する個人のデータを紐づける情報が除かれているため,データセットを跨いだ変数間の関連を検討することはできない。
もし異なるデータセットに含まれた個人のデータを紐づけ,複数のデータセットを跨いだ変数間の検討が可能になれば,従来の手法では実現し得なかったより大規模なデータの二次利用が可能になると考えられる。したがって,個人のデータを紐づけたデータ管理・共有が実現すれば,Real World認知科学(開他,2019)で想定されているような,大規模なデータを利用した人々のリアルな姿を反映した知見を生み出すことが可能となり,心理学研究を大幅に進歩させることができるかもしれない。また,複数の研究における個人のデータを紐づけ,共有することができれば,同一個人に関する全てのデータを集約して活用することが可能となる。例えば,子どもの心の発達を測定する様々な課題の成績を集約すれば,子どもたち一人ひとりの発達状態を正確に捉えることや,各個人の発達プロセスを追跡することができ,ここから得られたそれぞれの子どもたちの発達の状態を保護者にフィードバックすることもできるかもしれない。このように,個人のデータを紐づけたデータ管理・共有は,研究者だけではなく研究協力者にとっての利益にもつながりうる。とはいえ,個人情報そのものを他者に共有することはできないため,データセットを跨いだ変数間の関連の検討を実現するためには,個人情報を共有しなくても個人の紐づけを可能とする新しいデータ共有の形が必要となる。
そこで,本稿では,安全に個人を紐づけたデータ共有が可能となる手法として,分散パーソナルデータストア(以下,分散PDSとする;橋田,2013)に着目する。分散PDSとは,データの収集者がデータを管理するのではなく,データを提供した個人自身がデータを管理するシステムである(橋田,2020)。分散PDSを用いれば,一つひとつのデータからは個人情報が取り除かれていても,一人の個人から共有されるデータは全て同一の個人のデータとして紐づけることが可能になる。
近年では,分散PDSを利用したオンライン実験・調査プラットフォームも開発されており,心理学研究においても分散PDSを利用しようとする取り組みがなされている(谷澤・開,2024; Yazawa et al., 2021)。ただし,分散PDSを心理学研究に利用する取り組みは始まってまだ日も浅く,心理学研究において分散PDSを普及させるうえでどのような課題があるのか,普及した際にどのような恩恵があるのかについては十分な議論がなされていない。以上から,本稿では,心理学研究において分散PDSを普及させるうえで乗り越えるべき課題と分散PDSの普及が心理学研究にもたらす利点について論じる。
はじめに,本稿の構成について整理する。まず,本稿では分散PDSの概要についての説明,および研究実装に向けた現状について整理する。とりわけ,研究実装に向けた現状については,現在開発されているツールについて紹介し,分散PDSの研究利用に向けた環境が構築されつつあることを示す。また,これらのツールを用いる利点と分散PDSを心理学研究において活用するまでに克服しなければならない現状での課題についても整理する。次に,上記の克服しなければならない課題のうち,プライバシーの懸念がシステムの普及を妨げる可能性に着目し,データを基に実際に分散PDSを普及,運用するうえで克服する必要のある課題についてさらに論じる。最後に,こうした課題を乗り越えた先に,分散PDSの利用が心理学研究に何をもたらすのかについて具体的な活用案を提示しながら論じる。なかでも,分散PDSの利用が教育,発達などの領域における縦断デザインの研究を実施するうえで有用であることを示す。
まず,分散PDSの概要について説明する。次に,分散PDSの研究利用のために開発されたツールについて紹介し,分散PDSの研究利用に向けた現状について整理する。
分散PDSの概要と利点我々の日常生活では様々なパーソナルデータ(例えば,ショッピングサイトでの購買履歴,位置情報,睡眠時間や心拍数などのヘルスデータ)が研究機関・企業によって収集され,様々なサービスの提供に利用されている。しかし,従来の一極集中型のデータ管理は,大規模な情報漏洩が起こり得るというセキュリティ上のリスクが存在すること,パーソナルデータを収集された個人(以下,被データ収集者とする)自身がデータの管理状況や利用状況を知ることができない不透明な部分があるという問題点を抱えていることが指摘されている(橋田,2013)。これらの問題に対して,近年では新たなデータ管理の手法として,個人が自らのパーソナルデータを保存・管理するシステムとして分散PDSが活用されている(橋田,2014, 2020; 山上他,2022)。
例えば,現在運用されている分散PDSのシステムの一つであるPersonary(橋田,2014)では,被データ収集者自身が持つクラウドサービス(例えば,Google Drive)のストレージ上に,被データ収集者のみが復号できるように暗号化したデータを保存する(橋田,2014; 谷澤・開,2024)。これにより,データの保存先であるクラウドサービスの提供者を含む他者から,データの内容をのぞき見られることなく安全に被データ収集者自身がデータを管理することが可能になっている。さらに,データが暗号化されていることで,たとえデータが漏洩したとしてもデータの内容を盗み取られることは防止できる。このように,分散PDSのシステムを用いれば,被データ収集者自身が安全性を担保した状態でデータを管理することができる。なお,本稿では紙幅の都合で紹介はしないが,データの暗号化以外の方法で分散PDSを実現しているシステムが存在している。その他の分散PDSのシステムの詳細については,谷澤・開(2024)および Yazawa et al.(2021)を参照されたい。
また,分散PDSは,安全に個人がデータを管理するだけではなく,データの共有が従来よりも容易になるといった副産物的な利点があることも指摘されている(橋田,2020)。具体的には,データを共有するために二次利用者がデータを収集された人物に対して同意を得る手順が簡略化されることがあげられる(Figure 1)。従来のデータ管理システムでは二次利用者と被データ収集者の間にデータ収集者が介在している。そのため,データ取得時からデータ収集者が二次利用を想定して被データ収集者に同意を得ていない限り,二次利用者は,データ収集者にデータの二次利用をすることに対する同意を得て,かつ被データ収集者への同意確認を依頼し,被データ収集者からデータの二次利用について同意を得なければならず,時間やコストがかかるという課題を抱えている。しかし,分散PDSではデータを収集された個人自身がデータを管理しているため,二次利用者は被データ収集者に対して直接的に二次利用の同意を得ることが可能となる。
従来型と分散PDSによるデータ共有
分散PDSの導入によりデータ共有が容易になるという側面は,医療や観光,高齢者支援の分野などでも注目され,各分野のサービス向上に貢献することが示唆されている(橋田,2016; 佐藤他,2018; 柴田他,2022)。例えば,医療の場合,本来であれば通院している病院がカルテなどの個人情報を管理しているため,旅行など通院している病院から遠く離れた地でカルテの個人情報を参照して治療を受けることはできない。しかし,分散PDSによりデータの管理元が個人自身になれば,通院している病院以外の医療機関にデータの共有をするかどうかを個人自身が選ぶことができ,共有することで複数の医療機関からの治療を受けることが可能となる(橋田,2014)。また,高齢者支援では医療機関や介護機関が保持している高齢者の身体状態などの個人情報を高齢者自身が管理し,高齢者の介護やサポートに携わる家族や地域住民などの関係者に任意で共有可能になれば,より高齢者自身の状態に合わせた介護やサポートが可能になると考えられている(柴田他,2022)。
このように,分散PDSによりデータの共有が容易になることで,様々なサービスの向上が見込まれる。しかし,分散PDSによりデータの共有が容易になるという側面は,こうした商業的・実践的な分野だけではなく,研究分野においても有用であると考えられる。例えば,地理的な制限などにより研究リソースの限られた研究者にとって既存のデータの二次利用は重要な研究手法となり得る(Levenstein & Lyle, 2018)。また,既存データの共有は,同じデータを再度分析した場合に同じ結果が得られることを意味する分析の再生性,同じデータを異なる分析手法で分析した際に結論が大きく変わらないことを意味する分析の頑健性など,科学的知見の信用性を確かめるうえで重要な手続きであることも指摘されている(武藤,2022)。こうした背景も一因となって,現在では分散PDSを研究利用するためにツールが開発され,環境構築が進められている(Yazawa et al., 2021)。次節では,これらのツールについて紹介し,分散PDSを研究利用するためにどこまでの環境が構築されているのかについて整理する。
研究利用に向けたツールの開発近年,分散PDSの研究利用を可能とするツールとして,心理学の多様な実験や調査の手法に対応したオンライン実験プラットフォームであるGOod Experiment for Mankind Online(GO-E-MON)が開発されている(GO-E-MONの詳細については,谷澤・開(2024)および Yazawa et al.(2021)が詳しい)。GO-E-MONは,Personaryとの連携により,分散PDSを利用したデータ管理・共有を可能にしたオンライン実験プラットフォームである(Figure 2)。GO-E-MONでは,収集されたデータを実験者と参加者のPersonaryに紐づくクラウドストレージへ送信し,GO-E-MON内からは削除することで,データを一か所で集中管理しない仕組みが作り上げられている。また,上述のPersonaryによるデータの暗号化に加え,GO-E-MONでは個人を特定できないように仮名IDが付加され,より安全にデータの分散管理を行うための機能が備わっている。さらに,GO-E-MONはPersonaryの機能を利用することで,仮名IDが付与されたデータのまま安全にデータ共有を行う仕組みも実現している。Personaryはデータをチャネルという単位で管理しており,他者へのデータ共有はこのチャネル単位で行われる(Figure 3)。つまり,同一チャネル内に存在するデータは,GO-E-MONによって異なる仮名IDが付加されていてもすべて同じ参加者のデータである。そのため,Personaryによってチャネルごとデータが共有されれば,データに付与された仮名IDはばらばらなまま,一見すると誰のデータかが分からない安全な状態を維持しながらデータ共有が行われる。以上のように,GO-E-MONの開発により,既に安全に分散PDSによるデータ管理・共有を行う土壌が整えられつつある。
GO-E-MONを利用した分散PDSの概略
Personaryを用いたデータ共有
また,上記では,GO-E-MONの利点としてデータの管理・共有における安全性に焦点を当てたが,その他にもGO-E-MONには大きな魅力がある。まず,GO-E-MONでは自前のサーバーを用意せずともオンライン実験の実施が可能である点である。通常,jsPsychを利用してオンライン実験をする場合にはデータを保存するために自前のサーバーを用意しなければならない(詳細は,黒木(2021)を参照のこと)。しかし,GO-E-MONではPersonaryとの連携により各参加者の端末がデータの保存先として存在するため,サーバーを自前で用意する必要がなく,通常のオンライン実験と比べて実験者はサーバーに関する知識を持たずとも実験が可能である。また,外部デバイスと連携し,データ収集が可能である点もGO-E-MONの魅力の一つである。例えば,谷澤・開(2024)では,メッセージングサービス(例えば,LINE)との連携により経験サンプリング法のような縦断的なデータの収集や,ウェアラブルデバイスとの連携により実験参加時の生理指標の計測も可能であることが紹介されている。このように,外部デバイスとの連携により多彩なデータの収集が可能であるという点でもGO-E-MONは有用であるだろう。
その一方で,GO-E-MONやPersonaryを用いたデータの管理・共有には課題もある。まず,GO-E-MONとPersonaryを初めて利用する際にはGO-E-MONでのアカウント登録,Personaryのインストール,GO-E-MONとPersonaryの連携などいくつかの準備が必要であることがあげられる。既存のオンライン調査プラットフォームでは,参加者はプラットフォームで発行されるURLから回答するだけで調査に参加できるだけに,初回のみではあるがこうした準備時間の長さは,参加者にとって負担となるかもしれない。
次に,Personaryの利用には,アプリをスマートフォンやPCなどの情報端末にインストールし,クラウドストレージと連携させる必要があるが,スマートフォンやクラウドストレージを利用することに抵抗感がある参加者もいるかもしれない。このような抵抗感を取り除くことがGO-E-MON,Personaryの普及を促進する要因となり得ることから,本格的な運用までに対策が必要であると考えられる。なお,個人情報を管理する端末と分散PDSのアプリを紐づけることへの抵抗感がアプリの利用に及ぼす影響については次節でデータを用いて検証する。
最後に,実験者と参加者以外の第三者がデータを共有するための枠組みが現時点では整備されていないことが課題としてあげられる。先述のように,GO-E-MONとPersonaryを用いた分散PDSによるデータ管理では,データを収集した各研究者とデータを収集された個人のみにデータが送信される。つまり,現状のシステムでは,第三者は誰がどのデータを持っているのかを知ることができない仕組みとなっている。これでは第三者がデータの二次利用を試みようにも,誰に対してデータの共有を依頼してよいのかが分からない。そのため,分散PDSを用いて不特定多数の他者へのデータ共有を行うには,誰がどのデータを所持しているのかに関するメタ情報のリストを用意し,それを管理するシステムや機関が必要となる。橋田(2017, 2020)は,このようなメタ情報リストを作成,管理し,データを管理している個人とそのデータを利用したい個人とをマッチングさせる役割を担うシステムや機関を「メディエータ」と呼んでいる。GO-E-MONとPersonaryを用いた分散PDSの枠組みにおいても,今後,メディエータが整備されることで円滑なデータ共有が可能となるだろう。なお,分散PDSのシステムが普及し広く利用されるようになれば,メタ情報の数も膨大になり個人では管理が難しくなることが予想されるため,メディエータは集団や組織である方が良い。とりわけ,データを収集した尺度や実験課題,調査・実験デザインにも精通している集団や組織であれば,二次利用をしやすいメタ情報のリストが作成可能である。このことから,メディエータを担う集団の構成員には,二次利用に必要な情報を選定できる各研究領域の研究者が含まれている方が好ましいと考えられる。ただし,メディエータは,データを管理している個人ともデータを利用したい個人とも利益相反の関係にあってはならないため,独立した中立の立場である必要があるとされている(加藤他,2020)。あるメディエータと利益相反が生じる個人が分散PDSを利用できないという問題を生じさせないためにも,(ピアレビューのように)利益相反のないメディエータを選択できるようにメディエータを構成するメンバーの数を増やすなどの工夫も必要だろう。こうした要素を踏まえ,メディエータを誰が整備し,どのように運用するのかについては,今後さらなる議論を重ねる必要がある。
先述のように,GO-E-MONやPersonaryを利用した分散PDSの普及を促進するためにはいくつかの課題が残されている。その一つとして,Personaryの利用には,調査協力者が自身の持つ情報端末(スマートフォン,PC)にアプリをインストールし,クラウドストレージと連携させる必要がある。しかし,個人の情報端末やクラウドストレージの利用が,調査協力者にとっては心理的なハードルが高い可能性がある。一方で,従来の研究では,人は自身のプライバシーの懸念と金銭的なメリットを秤にかけたとき,金銭的なメリットがプライバシーの懸念を上回れば,金銭的なメリットを優先した意思決定を行うことが指摘されている(Culnan & Bies, 2003; Dinev & Hart, 2006; Laufer & Wolfe, 1977)。このことから,分散PDSのシステムに関しても調査謝金などの金銭的なメリットを増やすことで利用が促進されることが予測される。そこで,著者らのグループは,個人のプライバシー意識や金銭的メリットがGO-E-MONおよびPersonaryの利用に与える影響について調査を行った。
方法本調査は,大阪大学大学院人間科学研究科行動学系研究倫理委員会より承認を受け,実施された(HB023-141)。参加者のリクルートには,インターネットクラウドソーシングサイトLancersを用いた。調査はプライバシー意識の個人差や,分散PDSに関するアプリやサービスを利用する際に必要な金銭的メリットを尋ねるTime 1,実際に分散PDSに関するアプリやサービスであるGO-E-MON,Personaryの利用を依頼するTime 2の2時点で行われた。Time 1では500名が調査に参加し,重複して回答した参加者,質問文を精読しなかった参加者を取り除くことができるDirected Questions Scale(DQS; Maniaci & Rogge, 2014)に誤答した参加者を除く478名(男性292名,女性181名,その他=5名;Mage=41.39, SD=9.54)を分析の対象とした。Time 2ではTime 1に参加した478名のうち,Lancersを介して個別での依頼を受け付けていた469名(男性288名,女性176名,その他=5名;Mage=41.45, SD=9.54)に対してGO-E-MON,Personaryの利用を依頼した。Time 2においてGO-E-MON,Personaryを利用した参加者は124名であった。
参加者にはTime 1,Time 2のいずれにおいても調査への参加は任意であること,回答の拒否や中止は自由であり,そのことによって不利益が生じないことがWebページ上に記載された説明文で提示された。その後,調査への参加に同意するか否かの確認が行われ,同意した参加者にのみ調査を行った。
Time 1では,まず,プライバシー意識尺度(太幡・佐藤,2014)のうち,自己のプライバシー意識に関する7項目(他者にプライベートな質問をされたくない,など)について「1. あてはまらない」から「5. よくあてはまる」の5件法で回答を求めた。その後,金銭的メリットについて,「私たちは,今後の調査でみなさまの回答データをみなさま自身が管理するアプリやサービスを導入する予定です。調査で使用するアプリやサービスにおいて,以下のような内容が求められた場合にどの程度の金額であれば,利用に同意しますか。」と教示し,GO-E-MONおよびPersonaryを利用するうえで必要となる設定や環境の構築・維持((a)Googleアカウントを使ってWebサイトやサービスにログインする,(b)調査で使用するアプリをダウンロードする,(c)調査で使用するアプリからGoogleアカウントのアクセス許可を求められる,(d)Google DriveやDropboxなどのクラウドを外部アプリと連携する,(e)調査で使用するアプリを調査後もインストールしたままにする),およびそれらの組み合わせについて求められた場合に必要な金銭的メリットについて具体的な金額を尋ねた。その際,いくら金銭的メリットがあっても利用に同意しないと考える場合には「同意しない」と記入するように求めた。最後に調査の目的とTime 2に関する説明を行い,Time 1の調査は終了した。
Time 2では,GO-E-MONおよびPersonaryの概要,使用目的についての説明文をWeb上で提示し,GO-E-MONのアカウント作成,Personaryの参加者自身の端末へのインストール,GO-E-MONとPersonaryの連携の順に依頼した。その後,GO-E-MON上で作成したWeb質問紙を用いて,GO-E-MONとPersonaryを使用した感想について自由記述で回答を求めた。最後に調査の目的についての説明を行い,Time 2の調査は終了した。GO-E-MONとPersonaryを使用するための設定を行うかどうかは全て任意であり,GO-E-MONとPersonaryの使用に同意しない場合には,その時点で調査は終了した。
なお,本調査ではTime 1でGO-E-MONとPersonaryの使用に同意するうえで必要な金銭的なメリットについて参加者に回答を求めたものの,実際にGO-E-MONとPersonaryを使用するTime 2の参加謝金には上記の回答を反映させなかった。これは,Time 2でのGO-E-MONおよびPersonaryの使用に同意するか否かが,プライバシー意識の個人差だけではなく,謝金の額によって変動することを避けるためであった。先行研究で指摘されている通り,プライバシーにかかわる情報の流出といったリスクがあったとしても金銭的なメリットがそれを上回る場合には,プライバシーに関わる情報の開示が行われる(Laufer & Wolfe, 1977)。GO-E-MONおよびPersonaryの設定には,個人情報との紐づけなどの工程(例えば,「調査で使用するアプリからGoogleアカウントのアクセス許可を求められる」)も含まれることから,Time 1で回答した金銭的なメリットは先行研究と同様に,個人情報の開示に必要な金額を一部反映していると考えられる。このことから,Time 2のGO-E-MON,Personaryの使用との関連において,Time 1でのプライバシー意識の個人差とTime 2での参加謝金の影響が交絡する危険性を考慮し,Time 2の参加謝金はTime 1と合わせて300円とした。以上が,本調査の手続きである。
結果ここからは,調査の結果について報告する。まず,プライバシー意識の尺度項目について,α係数を算出した結果,α=.82と十分な値が示されたため平均得点を算出し,尺度得点として用いた(M=3.98; SD=.63)。
次に,GO-E-MONおよびPersonaryを利用するうえで求められる設定,環境の構築・維持に同意する場合に必要となる金銭的メリットについて平均額を算出した(Table 1)。その結果,単一の行為に関するレベルでは「Googleアカウントを使ってWebサイトやサービスにログインする」が最も平均額が低く(441.76円),「調査で使用するアプリを調査後もインストールしたままにする」がそのほかの単一の行為より平均額が高かった(1577.38円)。また,GO-E-MONおよびPersonaryを実際に利用するうえで必要となる行為,5つ全てを組み合わせた場合が全項目のなかで最も平均額が高く,3662.67円であった。
分散PDSツールの利用に関わる各設定と必要な金銭的なメリットの平均額(SD)
金銭的メリットの平均額(SD) | ||
---|---|---|
(a)Googleアカウントを使ってWebサイトやサービスにログインする | 441.76 | (2737.29) |
(b)(調査で使用する)アプリをダウンロードする | 568.74 | (2985.00) |
(c)(調査で使用する)アプリからGoogleアカウントのアクセス許可を求められる | 642.53 | (3262.28) |
(d)Google DriveやDropboxなどのクラウドを外部アプリと連携する | 947.77 | (4038.75) |
(e)(調査で使用する)アプリを調査後もインストールしたままにする | 1577.38 | (7150.31) |
(a)+(b) | 918.18 | (4223.23) |
(a)+(b)+(c) | 1813.37 | (9230.75) |
(a)+(b)+(c)+(d) | 2457.08 | (10375.74) |
(a)+(b)+(c)+(d)+(e) | 3662.67 | (12276.69) |
プライバシー意識や金銭的メリットと分散PDSに関するアプリやサービスの利用に同意する人数との関連を明らかにするために,金銭的メリットにおいて具体的な金額を記入した参加者を同意,いくら金銭的なメリットがあっても同意しないと回答した参加者を非同意としたダミー変数を作成し(非同意=0,同意=1),プライバシー意識を独立変数,利用に同意したかどうかを従属変数とするロジスティック回帰分析を,同意を求められる各行為やそれらの組み合わせについて実施した(Table 2)。その結果,単一の行為としては「(調査で使用する)アプリをダウンロードする」においてのみプライバシー意識の主効果が有意であった(p=.03; Bonferroniの補正済み)。また,行為の組み合わせについてはプライバシー意識の主効果がいずれも有意であり(ps<.05; Bonferroniの補正済み),プライバシー意識が高いほど分散PDSに関するアプリやサービスの利用において求められる設定,環境の構築・維持に同意する人数が少なくなることが示された。
分散PDSツールの利用に関わる各設定の非同意人数とプライバシー意識との関連
非同意(人) | プライバシー懸念と利用同意の関連 | ||||
---|---|---|---|---|---|
OR | 95%CI | ||||
注)ORはオッズ比を示す。有意水準,95%CIはBonferroniの補正後の値を示す。 *p<.05, **p<.01 |
|||||
(a)Googleアカウントを使ってWebサイトやサービスにログインする | 107 | .78 | [.47 | , | 1.29] |
(b)(調査で使用する)アプリをダウンロードする | 91 | .51* | [.28 | , | .92] |
(c)(調査で使用する)アプリからGoogleアカウントのアクセス許可を求められる | 191 | .73 | [.47 | , | 1.12] |
(d)Google DriveやDropboxなどのクラウドを外部アプリと連携する | 227 | .73 | [.48 | , | 1.11] |
(e)(調査で使用する)アプリを調査後もインストールしたままにする | 233 | .69 | [.45 | , | 1.05] |
(a)+(b) | 141 | .58** | [.36 | , | .95] |
(a)+(b)+(c) | 189 | .56** | [.36 | , | .88] |
(a)+(b)+(c)+(d) | 237 | .60** | [.39 | , | .92] |
(a)+(b)+(c)+(d)+(e) | 261 | .63** | [.41 | , | .95] |
また,プライバシー意識の高さによって,実際に分散PDSに関するアプリの利用が阻害されるかを明らかにするために,Time 1で回答を行った参加者のうち,Time 2においてPersonaryのインストールおよびGO-E-MONでの質問紙への回答に同意した参加者を参加,同意しなかった参加者を非参加としたダミー変数を作成し(非参加=0,参加=1),プライバシー意識を独立変数,Time 2への参加に同意したかどうかを従属変数とするロジスティック回帰分析を実施した。その結果,プライバシーの主効果は有意ではなく(OR=.91, p=.55, 95%CI[0.55, 1.12], Bonferroniの補正済み),プライバシー意識の高さと実際に分散PDSのアプリおよびサービスの利用を行うか否かについては関連がみられなかった。
考察個人のプライバシー意識や金銭的メリットがGO-E-MONおよびPersonaryの利用に与える影響について検討した結果,Time 1ではGO-E-MONおよびPersonaryを利用するうえで必要になる設定や環境の構築・維持についての条件が増えるほど,参加者の金銭的要求が増えることが示された。また,Time 1ではプライバシー意識が高い個人はGO-E-MON,Personaryを利用するうえで必要になる設定や環境の構築・維持にかかわる条件が複数ある場合に,金銭的なメリットがいくらあったとしても利用に同意しないことが明らかになった。先行研究によれば,個人情報が利用される際には,プライバシーの懸念が増加するほど,個人情報が利用される際に求める対価も増加する(Culnan & Bies, 2003; Dinev & Hart, 2006; Laufer & Wolfe, 1977)。このことから,複数の個人情報に紐づいた端末やシステムを利用することが参加者のプライバシー懸念を高め,それに伴って金銭的要求も増加したと考えられる。さらに,自己のプライバシーへの関心が強い個人は複数の個人情報に紐づいた端末やシステムを利用することについてより強いプライバシー懸念を抱いたために,金銭だけでは対価が不十分と考え,GO-E-MON,Personaryの利用に同意しなかった可能性がある。
プライバシー意識の高い個人に対してもGO-E-MON,Personaryを用いた分散PDSを普及していくためには,金銭ではないメリットや付加価値を設けることが必要なのかもしれない。例えば,研究参加によって得られたデータから副次的に子どもの発達の度合いや自身の健康状態を知ることができるなど,参加者にとって重要な情報のフィードバックが分散PDSを利用するモチベーションを維持するインセンティブとなる可能性が指摘されている(鹿子木他,2024)。その他にも,アプリ・サービスの利用を促進する手段として,ゲームではないものにゲーム要素を取り入れるゲーミフィケーションの有効性が指摘されており(藤田,2016),研究参加によってポイントやリワードを獲得できるようにするなど,ゲーミフィケーションを活用することで参加者のモチベーションを維持することも一案として考えられる。また,上記の二案のように,参加者に何らかの外的な報酬を与えて外発的な動機づけを高める方法だけではなく,参加者自身の研究参加の興味を高めるなど内発的な動機づけを高める方法を併用することで参加者に分散PDSのシステムをより継続して利用してもらえる仕組みを考えることも重要だろう。例えば,自分自身が参加した実験・調査のフィードバックやプレスリリースのような研究成果を紹介する記事に気軽に触れることができるサービスやページをGO-E-MONやPersonaryに組み込んでも良いかもしれない。これら以外にもどのようなメリットや付加価値があれば参加者が分散PDSのツールの利用が促進されるのかについて,今後検討していく必要があるだろう。
ただし,今回の調査では,個人の情報端末やGoogleアカウントの利用,クラウドストレージとの連携などの各過程について参加者がどの程度プライバシー懸念を抱いたかは測定していない。そのため,プライバシー懸念とは関係なく,複数の条件が課されることで作業コストが多いと感じたために参加者の金銭的要求が高くなった,あるいは,金銭的要求があっても利用しないと回答した可能性も考えられる。GO-E-MONおよびPersonaryの普及を促進するために,参加者のプライバシー懸念と作業コストのどちらに対して策を講じることが参加者の金銭的要求を低下させるうえでより有効であるかは改めて検証しなければならない。
ところで,Time 1ではプライバシー意識と分散PDSのツールの利用の同意には負の関連が見られたにもかかわらず,Time 1でのプライバシー意識の高さとTime 2での実際の参加率には関連がみられなかった。これらの結果の乖離は,プライバシー意識以外の要因によって生じている可能性がある。例えば,2時点参加することが面倒などの理由からそもそもサンプル全体として縦断調査への参加意欲が低かったことが考えられる。これにより,プライバシー意識の得点が高い個人だけではなく,分散PDSのシステムやアプリの使用自体には抵抗感がさほどないプライバシー意識の得点が低い個人もTime 2に参加せず,プライバシー意識と分散PDSのシステムやアプリの使用に関連がみられなかった可能性がある。また,本調査では,参加者の情報リテラシーの個人差を考慮していなかった。しかし,個人がどの程度情報リテラシーを有しているのかはサービス利用の判断に影響を及ぼしうる。例えば,情報リテラシーが低い人は,Time 2において安全なものを安全と判断できないために必要以上に厳しく分散PDSのシステムを利用しないと判断したのかもしれない。あるいは,情報リテラシーが低いがゆえに,抵抗感を抱くことがなく,言われるがままPersonaryのインストールやGO-E-MONとPersonaryの連携に応じた個人もいたと考えられる。今後は参加者の情報リテラシーの個人差も測定したうえで,分散PDSのツールの利用を促進する要因について検討すべきだろう。
ここまでは,GO-E-MON,Personaryを利用した分散PDSの課題について整理した。こうした課題が解消されれば分散PDSの活用は心理学を大いに発展させる可能性を秘めている。以下では心理学研究において分散PDSを活用するうえで考えられる4つの具体案を論じ,心理学研究における分散PDSの有用性について議論する。
複数の実験・調査に関するデータの二次分析通常,二次分析とは,ある目的に沿って収集された既存のデータを再分析する,あるいは,新しい仮説を検証したり新しい分析手法を適用したりすることを意味する(三輪・佐藤,2018; 佐藤他,2000)。例えば,解良他(2016)では,ベネッセ教育総合研究所が小中学生の学習意識や学力の実態について類型化することを目的として実施した大規模な調査データを用いて,中学生の学習動機のパターンや,学業達成と精神的健康との関連について検討している。また,川本他(2015)では,大阪大学社会経済研究所が人々の好みを表す効用関数を明らかにするために追跡調査をしている「くらしの好みと満足度についてのアンケート」において回答者の基本属性として収集されていたBig-Five特性に関する項目を用いて,Big-Five特性の年齢差と性差について検討している。
このように,既存の二次分析研究では同一データセット内に含まれている関心のある変数について再分析を行う。その際,変数の数が少ない場合には該当するデータセットを探すこともさほど難しくないが,関心のある変数が多い場合には該当するデータセットが存在せず,リサーチクエスチョンはあっても分析が実現しないということも起こり得る。
しかし,分散PDSを利用すれば,一つのデータセット内に関心のあるデータを含んでいなければならないという制限が取り除かれ,二次分析に取り組みやすくなる可能性がある。先述のように,分散PDSを用いた二次分析の場合には,複数の研究を跨いでデータ間の関連を検討することが可能である。例えば,ある参加者に対して,研究者Aと研究者Bがそれぞれ別のプロジェクトで実験を実施したとする。新たな研究者Cは参加者からPersonaryを用いてチャネル内のデータを共有してもらうことで,研究者Aが実施した実験のデータと研究者Bが実施した実験のデータの関連を調べることができる。分散PDSの利用は,幅広いリサーチクエスチョンに対応したデータを提供する潜在性をもつという点で心理学研究に大きなメリットをもたらすといえる。
発達研究における縦断デザイン複数回データを収集する縦断調査は,発達研究のような加齢の効果や個人内での発達について検証するうえで有用なデザインである(岡林,2006)。古くから発達研究において縦断調査は広く利用されており(伊藤他,2022),ごく最近では,乳幼児を対象とした発達研究において,継続的な縦断調査の実施や参加を可能にするオンラインプラットフォーム(Baby's Online Live Database; BOLD)が運用されている(加藤他,2024)。さらに,谷澤・開(2024)によって,乳幼児の縦断研究への分散PDSの利用可能性も議論されている。その一方で,縦断調査の実施には時間がかかるうえに,2時点目以降の脱落を加味し,1時点目で想定より多くのサンプルを集める必要があるなど横断調査にはないコストがかかる(荘島他,2017)。そのため,大規模な縦断研究を一個人が行うことは難しい。
しかし,分散PDSを用いて縦断研究を実施すれば,過去にある実験や調査に参加した対象に対して,リクルートを行うことで時間の経過を待たずして縦断研究が実施可能となり,こうした課題を解決できる可能性がある。例えば,5歳時点での変数Aが15歳時点での変数Bに与える影響を調べたいとする。通常の縦断研究であれば,1時点目の調査後,10年間待たなければ2時点目の調査を行うことはできない。その一方で,分散PDSを用いる場合には参加者がデータを管理しているため,5歳時点での変数Aに関するデータを持ち,かつ現在15歳の個人を対象に変数Bを測定するための調査に回答した人のリクルートをすれば縦断デザインでの調査が実施可能である。また,1時点目のサンプルから2時点目のサンプルを確保する通常の縦断研究とは異なり,分散PDSを利用した調査では,既に変数Aのデータを保持している個人でさえあればリクルートの対象となる。このことから,分散PDSを利用すれば2時点目での脱落を考慮した過剰なデータ収集が不要となるかもしれない。以上から,分散PDSの利用は縦断研究において非常に有用であると考えられる。
なお,縦断研究は,従来のデータベースを用いたデータ共有でも不可能ではないだろう。上記の例でいえば,5歳を対象に変数Aの調査を実施した研究者を見つけて連絡を取り,参加者にデータの共有の同意を取りつつ,2時点目の変数Bのリクルートをしてもらえば縦断研究が実施できないことはない。しかし,実際には,データをある研究者が集中的に管理する場合は,主張の異なる研究者にデータを使わせないということも起こりうる。実際に,一定数の研究者がデータ共有を求められても対応しないことが報告されている(Wicherts et al., 2011)。これは科学の進歩にとっては非常に問題であるだろう。しかし,分散管理の場合には,仮に研究者間が対立していても,参加者の許諾が得られれば研究は成立しうる。したがって,分散PDSの方が従来よりもスムーズに縦断研究を実施することができるかもしれない。
ただし,分散PDSにも留意するべき点はある。それは,倫理的に問題がある研究者が分散PDSの仕組みに参入しようとしたときにどう扱うかという点である。分散PDSを用いてデータを共有される研究者は参加者からデータを共有されるため,どのような研究者がデータを収集したのかは分からない仕組みになっている。したがって,上記のような課題を解決するには,事前にデータを共有する研究者を第三者が評価する必要があるかもしれない。幸いにも分散PDSのデータ共有の仕組みには,収集したデータリストを管理するメディエータという第三者が介在する。実際に分散PDSを用いたデータ共有を進めるうえでは,データを共有する研究者をメディエータがどのように管理していくかも課題解決のうえで重要なポイントになるだろう。
教育場面における予防的支援への活用現在,教育現場では急速なEdtech(MEXCBT)の利用に先駆けて,児童・生徒に対して1人1台の端末が配布されるなどICT機器の活用が推進されている(文部科学省,2023a)。さらに,こうしたICT機器は学習支援だけではなく,児童・生徒の心や体調の変化を捉え,不登校やいじめ,自殺などの予防的支援にも役立てられている(例えば,COCOLOプラン;文部科学省,2023b)。例えば,ICT機器を利用した自殺予防の実践としてRisk Assessment of Mental and Physical Status(以下,RAMPSとする)の運用があげられる。RAMPSは,保健室に設置されたICT機器を用いて,児童・生徒が心身不調や自殺企図などに関する質問に回答することで,自殺リスクのある児童・生徒の早期発見・支援を行うためのツールである(北川・佐々木,2021)。実際に,北川・佐々木(2021)では,RAMPSの利用によって予想外の生徒から希死念慮や自殺企図歴などの情報が得られ,自殺リスクのある生徒の早期発見につながったことが報告されている。その他にも,1人1台端末を日々の健康観察に利用して児童・生徒の体調,生活リズム,メンタルヘルスの変化を記録するサービスが教師の積極的支援を促進することで,新規の不登校発生の予防に役立つことも示唆されている(和久田,2023)。このように,ICT機器を用いた児童・生徒への予防的支援は,複数のツールを用いて実施されており,その有効性が示されつつある。
ただし,これらのツールによって収集されたデータの管理・共有方法には改善の余地が残されている。予防的支援を目的としたツールで収集されたデータは,子どもたちの支援のために教員や医療機関などに共有される場合がある。しかし,これらのデータには自殺企図などのセンシティブな回答が含まれ得ることから,データの管理者や被共有者以外の目に触れない方法で安全に管理や共有を行うことが重要であると考えられる。
分散PDSは,こうしたセンシティブなデータを管理・共有する際にも有用である。例えば,先述のPersonaryを利用すれば,子どもたちの回答は暗号化され,任意の個人にのみ共有・情報の開示を行うことが可能になる。これにより,管理者・被共有者以外に回答データをのぞき見られるといった事態を防止できると考えられる。また,分散PDSによりデータを自分自身で管理することによって,子どもたち自身が援助要請を行いやすい環境を整え,より効果的な予防的支援が実現されるかもしれない。他者に回答が知られてしまうかもしれないという懸念は,子どもたちの回答を歪めてしまう。例えば,いじめ被害においては,いじめられていることを他者に知られたくない,打ち明けるのが恥ずかしいなどの理由から援助要請行動を抑制する被害者が一定数いることが指摘されている(木村・濱野,2010)。そのため,Personaryのようにデータを暗号化し,他者からのぞき見られるリスクのない分散PDSを用いることでより子どもたちの本心を引き出すことができるかもしれない。したがって,分散PDSの利用は,支援を必要としているものの声をあげることができない児童・生徒への支援を促進しうるという点でも導入する価値があると考えられる。
特定の調査対象者に対するデータ収集上記の3つの活用案は分散PDSの利用によるデータ共有の利点を心理学研究に利用することに焦点を置いていた。しかし,分散PDSによってデータを蓄積すること自体も心理学研究において重要な役割を果たす可能性がある。例えば,双子や不登校経験者,いじめの被害経験など通常のサンプルと比べて母集団の総数が少ない対象者に対して調査を行う場合があげられる。こうした母集団の総数が少ない対象者に調査を行う場合,同じ回答者に対して別の研究者が同じ変数を何度も測定することが起こり得る。例えば,双子を対象とした研究でいえば,対象者の属性としてBig Fiveに関する項目を何度も尋ねるという状況を想像してもらいたい。このような対象者の属性に関わる変数や毎回尋ねる調査項目については,分散PDSを用いてデータの蓄積が行われることで,回答者に何度も同じ回答を行うという労力を要しない倹約的な調査が可能となる。また,ある変数についての不登校経験,いじめの被害経験前後での変化を検討した場合も例にあげよう。不登校経験やいじめの被害経験などは,当時のことを回顧することが回答者にとって負担になる可能性がある。しかし,こうした経験をする前のデータが既に分散PDSによって蓄積されていれば,対象者に当時を回顧するなどの余計な負荷をかけることなく,経時的な変化を検討することができる。
また,上記のように特定の調査対象者自身に対してのみならず,こうした対象者に対して調査を実施したい研究者にも分散PDSの活用は希望をもたらすかもしれない。母集団の総数が少ない調査対象者に対するデータ収集は,対象者にアクセスできるかリソースを有していることが絶対条件であり,残念ながら現状では誰にでも実施できるものではない。しかし,分散PDSにより誰もがデータにアクセスすることができるようになれば,対象者に直接アクセスすることのできない研究者もデータを活用できると考えられる。
本稿は,心理学研究における分散PDSの可能性について議論することを目的としていた。まず,分散PDSの概要および現状構築されている環境,分散PDSのシステムの普及に関わる課題について整理した。そのうえで,分散PDSを心理学研究に利活用するための具体案について提示した。分散PDSを用いたデータの二次利用や縦断デザインでの研究は,心理学研究の発展に貢献する可能性が示唆された。ただし,これらの利活用案は分散PDSのシステムが広く普及し,データが蓄積されていることが前提となるため,分散PDSの利活用案を実現するためには,いかに広くシステムを普及させるか,そして,いかにデータを蓄積させるかが鍵となるだろう。
システムを普及させるうえで解決すべき課題については既に述べたとおりだが,なかでも参加者が分散PDSを利用したいというモチベーションの維持が重要であると考えられる。本稿では,参加者のモチベーションを左右する要因として金銭的なメリットと参加者のプライバシー意識に着目し,2時点の短期縦断調査を行った。その結果,金銭的なメリットが参加者の分散PDS利用のモチベーション維持に役立つ可能性も示された。その一方で,Time 1では,プライバシー意識が高い個人はいくら金銭的なメリットがあっても分散PDSの利用には同意しないことも明らかになった。このことから,分散PDSをより広く普及させるうえでは,金銭以外のメリットや付加価値を付与し,参加者が利用したいと感じるような取り組みが必要であると考えられる。上述のように,参加者にとって重要な情報など参加者のモチベーションを維持するインセンティブを提示するなどの方法が考えられるものの,どのようにインセンティブを設け,参加者の利用を促進していくのかについては今後さらなる議論が必要である。
また,分散PDSを普及させ,データを蓄積させていくためには,参加者だけではなく研究者が利用したいと考える仕組みづくりも必要不可欠である。本稿で想定している分散PDSの利活用案はあくまでデータが蓄積されることを前提としており,最初期に分散PDSを利用する研究者はこうした恩恵に与れない。そのため,参加者に対してだけではなく研究者に対しても分散PDSを用いることで生じるインセンティブを設ける必要があるかもしれない。分散PDSという新たな枠組みを広め,定着させていくためには,参加者と研究者の双方が分散PDSを利用し続けるための仕組みを考えていく必要があるだろう。
本論文に関して,開示すべき利益相反関連事項はない。
本研究は,JST「ムーンショット型研究開発事業」グラント番号(JPMJMS2293-05 JPMJMS2293-06)の支援を受け,実施された。
本論文の執筆に際し,谷澤 智史先生(東京大学),小林 勇輝先生(脳情報通信融合研究センター),赤松 大輔先生(京都教育大学)から貴重なご助言をいただきました。心より御礼申し上げます。