Journal of Japan Academy of Nursing Science
Online ISSN : 2185-8888
Print ISSN : 0287-5330
ISSN-L : 0287-5330
Original Articles
Assessment of Nurses’ Proficiency in Pre-hospital Care Using Activity Based on Wearable Camera Video: Comparison between Expert and Novice Flight Nurses
Morikatsu TsuchiyaKohta ItoSeiichi TakahashiTakayuki SakagamiKazuchika Manabe
Author information
JOURNAL FREE ACCESS FULL-TEXT HTML

2021 Volume 41 Pages 71-78

Details
Abstract

目的:フライトナースのプレホスピタル・ケアを対象として,撮影された動画のオプティカルフローから算出した活動量(以下,動画活動量)を測定した上で,熟練者と初心者の相違について比較するとともに,機械学習による分類性能について検討することを目的とした.本研究の結果が明らかとなれば,臨床における教育や業務の省力化,効率化が期待できる.

方法:熟練者および初心者フライトナースのべ30名を対象とした.対象者は,胸部にウェアラブルカメラを装着した上で業務に従事した.熟練者と初心者の分類のために機械学習および線形判別分析を行い,分類性能を検証した.

結果:動画活動量のエントロピーの中央値は,熟練者のフライトナースが有意に低値であった.各分析方法における分類性能(適合率,再現率,F1値)は,サポートベクターマシンとランダムフォレストが高かった.

結論:動画活動量のエントロピーが熟練性の指標となり得ること,エントロピーの経時的変化に対して機械学習を適用することにより,高い分類性能を示すことが明らかとなった.

Translated Abstract

Objectives: The purpose of this study was to compare differences between expert and novice flight nurses in pre-hospital care by activity measured from optical flow of captured video (hereafter referred to as “video activity”) and investigate the classification performance of machine learning. The results of this study are expected to save labor and improve efficiency of education and work in clinical settings.

Methods: A total of 30 expert and novice flight nurses were included in the study. The subjects were engaged in pre-hospital care with a wearable camera on their chest. To classify expert and novice flight nurses, we used machine learning and linear discriminant analysis to validate the classification performance of expert and novice flight nurses.

Results: The median entropy of video activity was significantly lower in expert flight nurses. The classification performance (precision, recall, F1-measure) for each analysis method was higher in support vector machines and random forests.

Conclusions: We found that the entropy of video activity can be an indicator of proficiency and that applying machine learning to changes in entropy over time shows high classification performance.

Ⅰ. はじめに

救急医療用ヘリコプター(以下,ドクターヘリ)は,「救急医療用ヘリコプターを用いた救急医療の確保に関する特別措置法」(e-Gov, 2007)により,

1.救急医療に必要な機器を装備し,及び医薬品を搭載していること.

2.救急医療に係る高度の医療を提供している病院の施設として,その敷地内その他の当該病院の医師が直ちに搭乗することのできる場所に配備されていること.

と定義され,日常の救急医療だけでなく,交通事故,労働災害,地震,台風,テロのような大規模災害における,現場での医師の治療による救命率の向上,予後の改善を図る役割を有する(小濱,2008).

ドクターヘリは通常,操縦士,整備士,フライトドクター,フライトナースが搭乗して,プレホスピタル・ケアに従事する.このように搭乗人数が限られたドクターヘリ業務において,それぞれのスタッフの担う役割は大きいと言える.中でもフライトナースには,通常看護師が勤務する部署などにおける業務と異なり,患者の適切なアセスメントに基づく看護だけでなく,(1)医師の治療処置介助および救急現場での対応,重症患者搬送,(2)医療機器・医薬品の点検,維持管理,(3)他職種との連携,コーディネート,(4)安全管理など,さまざまな役割が求められる(藤尾,2008).

フライトナースになるためには,看護師経験5年以上,救急看護経験3年以上,または同等の能力があることや,リーダーシップがとれる,などいくつかの選考基準がある(坂田ら,2007).しかしこの選考基準は,あくまでもフライトナースにとってごく基礎的な能力を担保するのみで,特殊な環境下で行われるドクターヘリ業務に円滑に適応するのは難しい.そのため,全国のドクターヘリ基地病院においては,新人フライトナースに対してさまざまな教育が試みられている(小濱ら,2008山根ら,2016).

このようなフライトナース教育の状況の中で,近年ビデオカメラの進歩にともない小型化が進み,身体などに容易に装着可能となったウェアラブルカメラの応用が試みられている(高橋ら,20142015).動画を使用した教育は,記憶や記録に頼らずとも装着者の行動の詳細が把握できるため,有用性が高いと考えられる.しかし,動画の編集や管理に加え,閲覧する時間の確保が必要となるため,多忙な業務の間でそれらを行うのは容易ではないと推測される.

ウェアラブルカメラで撮影された動画から身体活動量の算出を試みた既存研究として,コンピュータビジョン技術の1つであるオプティカルフローを応用した土屋ら(2020)による報告がある.土屋ら(2020)は,ウェアラブルカメラで撮影した動画の“ブレ”が身体活動を反映すると考えた.そして,この“ブレ”を定量化した値と加速度を比較した結果から,身体活動量としての一定の妥当性を結論づけている.そこで,土屋ら(2020)が開発した方法を,フライトナースに装着したウェアラブルカメラで撮影された動画に応用すれば,フライトナースの活動量が算出可能となり,さらには熟練性の評価が可能になるとの仮説を立てた.

一方,Shannon(1948)により情報理論に応用されたエントロピー(entropy,平均情報量)とは,その情報源がどれくらいの情報量を提供してくれるのかを平均的に予測したものである(青柳,1993).このエントロピー,あるいはこれに類する近似エントロピー(Approximate Entropy, ApEn)やサンプルエントロピー(Sample Entropy, SampEn)などについては,これまで身体動作の評価にも応用され,「単調さ」,「複雑さ」,「円滑さ」,「なめらかさ」などの評価の指標とされてきた(飯田ら,2007小島,2006小島・大渕,2012Kojima et al., 2008大橋ら,2018).

さらに近年,統計学における予測モデルの自動化技法として,機械学習が発展してきている.この手法には,データ駆動であり,データに線形性などの構造が要求されない特徴を持つ(Bruce & Bruce, 2017/2018).

そこで本研究においては,ドクターヘリ業務中のフライトナースを対象として,動画に基づく活動量(以下,動画活動量)を測定した上で,エントロピーを算出,そのデータに機械学習および線形判別分析を適用し,熟練者と初心者の分類性能について検討することを目的とした.本研究の結果が明らかとなれば,実際の動画をすべて確認せずとも熟練性が評価できるような,教育効果の評価の自動化の一助となる可能性がある.そして,主観の入りやすい人の評価の問題点を解消するばかりでなく,多忙を極める臨床における,教育や業務の省力化,効率化が期待できる.

Ⅱ. 方法

本研究における動画の撮影方法,分析方法等については,土屋ら(20202021)に準拠した.

1. 対象

私立大学病院所属の熟練者および初心者フライトナースのべ30名を対象とした.なお本研究においては,日本航空医療学会による認定指導者(日本航空医療学会,2006a2006b)あるいは同等の経験のある看護師を熟練者,それ以外を初心者として扱った.認定指導者の条件には,日本航空医療学会主催のドクターヘリコプター講習会を修了していること,指定施設において2年以上の勤務経験を有すること,航空機による救急救護・搬送症例を3年間で60例以上(1年あたり20症例以上を3年間)の搭乗症例を経験していること,などが含まれている.

2. 使用機器と手続き

動画の撮影にはウェアラブルカメラ(GoPro HERO3+ Black Edition CHDHX-302-JP: GoPro, Inc.)を使用した.動画の撮影にあたっては,ビデオ解像度1080 p,フレーム/秒60 fps,スクリーン解像度1920 × 1080で設定した.

ウェアラブルカメラは,回転式クリップマウント(REC-B53: REC-MOUNTS.INC)によって,対象者の胸部に装着した.フライトナースは,ウェアラブルカメラを装着したまま,ドクターヘリ業務に従事した.

得られたデータをPC(CF-LX3JEABR,Panasonic社製,OS:Windows 10 Pro,プロセッサー:Intel Core i5-4310U,動作周波数:2 GHz,RAM:8 GB)で分析した.

3. 分析方法

多くのドクターヘリ業務においては,ヘリコプター内ではなく,患者が発生した現場やその患者を収容した救急車内で治療や処置が行われる.対象とした基地病院においてもドクターヘリ業務は,多くが救急車内で行われた.そのため,2016年7月19日から2018年2月25日までの期間における,救急車内での活動30事例の動画を抽出した.この救急車内での活動のうち,救急車の乗車から救急車の降車もしくは搬送方法決定までの時間を分析対象とした.条件を統制するために,患者接触前から医療機関が関わる症例,動画活動量に影響する胸骨圧迫などの処置が行われる可能性がある重症度が高い症例(Revised Trauma Score(以下,RTS)が1未満),動画時間300秒未満1,000秒以上の動画については分析対象から除外した.なお,フライトナースにはドクターヘリの要請を受ける運行管理室から消防本部名のみが連絡される.そのため,出動時点で患者の重症度などに基づくフライトナースの選定は行っていなかった.

動画活動量の算出にあたっては,Visual C++ 2010 Express(Microsoft社製)および画像処理ライブラリOpenCV 2.2(OpenCV team, 2020)のCalcOpticalFlowPyrLK関数(画像ピラミッドを利用してLucas-Kanade法を反復実行することにより,疎な特徴集合に対するオプティカルフローを求める)(Lucas & Kanade, 1981OpenCV 2.2 C++ Reference, 2010)を使用した.

動画は静止画の集合体であるため,ある時刻の静止画における特徴点座標を pi ,次の静止画における特徴点座標を p'i とすると,特徴点の移動量は(1)式で得られる.本研究においては,オプティカルフローの算出にcvGoodFeaturesToTrack関数により画像上のコーナー(角)について100箇所の特徴点検出をおこない,各点の移動量の平均値をフレーム間の動画活動量として(2)式により算出した.

  

p'i-pi (1)

  

動画活動量 pixels =i=1100p'i-pi100 (2)

動画活動量のデータについては,妥当性を検証した土屋ら(2020)の方法に準拠し,ノイズ成分を除去するために1.0 Hzの2次バターワース型ローパスフィルター(Butterworth, 1930)を適用した.なお1 Hz以下の動作とは,体幹の動きなど,比較的緩徐な動作である.

対象者間のプレホスピタル・ケアの動作の複雑性を評価するために,動画活動量のエントロピーを算出した.エントロピーの算出には,R version 4.0.2(R Core Team, 2020)のentropyパッケージを使用した.

また,動画活動量のエントロピーの経時的変化が,初心者と熟練者の分類を可能にすると考えた.そこで,対象者間のプレホスピタル・ケアの動作の複雑性の経時的変化から初心者と熟練者を分類するために,10分割した作業時間それぞれの時間帯ごとに個別に算出した動画活動量のエントロピーを一つの変数として扱い,機械学習および線形判別分析を行った.

本研究では,機械学習としてランダムフォレスト(Random Forest, RF),ニューラルネットワーク(Neural Network, NN),サポートベクターマシン(Support Vector Machine, SVM)を,さらに統計的分類方法として線形判別分析(Linear Discriminant Analysis, LDA)を行った.また,ランダムフォレストによる分類に用いる変数の重要度を検討するために,Gini不純度に基づく変数の重要度の平均値の比較とともに,高値を示した作業時間の動画から動作の内容を抽出した.さらに,得られたデータ30事例のうち,ランダムに60%(19事例)を学習用データセットとし,残りの40%(11事例)を評価用データセットに振り分け,機械学習および線形判別分析の学習の結果についてホールドアウト法(Hold-out method)による検証を行った.分析には,ランダムフォレストにおいてはrandomForestパッケージを使用し,木の数は500本,分岐に用いる変数の数は3,ニューラルネットワークにおいてはnnetパッケージを使用し,隠れ層のユニット数は3,サポートベクターマシンにおいては,kernlabパッケージを使用し,コストパラメータCは1.18,とした.線形判別分析においてはMASSパッケージを使用した.いずれもR version 4.0.2(R Core Team, 2020)のパッケージを使用した.なお,記述した引数以外はデフォルト値を用いた.

機械学習においては乱数を使用しているため,同一の評価用データセットに対して分類を繰り返しても結果が同じになるとは限らない(金・村上,2007).そのため,金(2014)を参考に,評価用データセットに対する分類の結果を100回繰り返した際の,初心者の分類における適合率(precision,精度,(3)式:初心者と分類されたもののうち初心者の割合),再現率(recall,感度,(4)式:初心者のうち初心者と分類された割合),F1値(F1-measure,(5)式:適合率と再現率の調和平均F1値は0~1の値で出力され,大きいほど分類性能が良い(正解率が高い)と評価される(金,2014))を以下の式で算出し,そのマクロ平均の比較により分類性能の評価を行った(数式の用語は表1に基づく.線形判別分析については,マクロ平均は算出せず).算出した値は,平均値(標準偏差)で示した(線形判別分析を除く).

表1  分類結果の混同行列
分類結果
Positive Negative
実際のデータ Positive TP(True Positive) FN(False Negative)
Negative FP(False Positive) TN(True Negative)

  

適合率  Precision= TPTP + FP (3)

  

再現率  Recall = TPTP + FN (4)

  

F1 F1-measure = 2RecallPrecisionRecall+Precision (5)

各事例の患者特性(性別,年齢,病因,RTS)および撮影時間,エントロピーは,初心者と熟練者ごとにクロス表あるいは中央値(四分位範囲)で示した.さらに,変数の独立性,中央値の差を検証するためにFisherの正確確率検定あるいはMann–WhitneyのU検定を行った.統計的検定においては有意水準を5%とした.分析には,R version 4.0.2(R Core Team, 2020)を使用した.

4. 倫理的配慮

本研究の実施にあたっては,日本医療科学大学研究・倫理委員会の承認を得る(受理番号:2017023)とともに,対象者の匿名性,個人情報の守秘性等について十分に配慮した.また,動画は研究目的で撮影せず,教育目的で撮影されたデータを2次的に利用した.なお,本研究の対象者であるフライトナースには,教育の開始時に,担当者から撮影した動画を研究で使用する可能性があることを説明した.さらに,動画の研究への使用について拒否する機会を設けていた.

Ⅲ. 結果

30事例中,初心者の事例は22事例,熟練者の事例が8事例であった.

表2は,フライトナースの熟練性による各事例の患者特性・撮影時間・エントロピーを比較したものである.患者特性(年齢,性別,病因,RTS)および撮影時間においては,初心者と熟練者の事例で有意差を認めなかった.動画活動量のエントロピーの中央値(四分位範囲)は,初心者が10.15(0.37)nats,熟練者が9.72(0.70)natsであり,熟練者が有意に低かった(p < .01).

表2  熟練性による各事例の患者特性・撮影時間・エントロピーの比較
N 初心者
22
熟練者
8
p
年齢 55.00(25.75) 64.5(21.75) .86
性別 1.00
6 16
2 6
病因 1.00
外因性 6 16
内因性 2 6
RTS 7.84(0.22) 7.70(0.40) .50
撮影時間 677.97(239.93) 495.85(268.25) .20
エントロピー 10.15(0.37) 9.72(0.70) <.01

各対象者の作業時間を10分割した場合における,動画活動量のエントロピーのデータを元に実施した機械学習および線形判別分析による評価用データセットでの検証の結果を表3に示した.各分析方法における分類性能は,適合率がサポートベクターマシン,再現率がランダムフォレスト,F1値はサポートベクターマシンとランダムフォレストが高かった.ランダムフォレストによる学習におけるGini不純度に基づく変数の重要度の平均値は,10分割した作業時間のうちの3番目,8番目にピークがあり,二峰性の分布を呈していた(図1).

表3  各分析方法における分類性能の比較
適合率 再現率 F1値
ランダムフォレスト .87(.02) .87(.03) .87(.02)
ニューラルネットワーク .22(.30) .64(.19) .59(.11)
サポートベクターマシン .99(.04) .79(.02) .88(.03)
線形判別分析 .75 .85 .80
図1 

作業時間を10分割した場合におけるGini不純度に基づく変数の重要度の平均値の変化

Gini不純度に基づく変数の重要度の平均値がピークを示した,3番目,8番目の作業時間における動作を比較すると,受傷機転やバイタルサイン測定などの情報収集や記録については相違がなかった.しかし,3番目においては,点滴などの処置や処置の介助が多く,8番目においては,物品の片付け,患者のパッケージング(患者を搬送可能な状態に固定等を行う)などの搬送準備が多かった(図2).

図2 

Gini不純度に基づく変数の重要度の平均値がピークを示した作業時間における動作の分布

Ⅳ. 考察

本研究においては,プレホスピタル・ケアにおけるフライトナースの動画活動量を測定した上で,エントロピーを算出,そのデータに機械学習および線形判別分析を適用し,熟練者と初心者の分類性能について検討した.

結果として,動画活動量のエントロピーの中央値は,初心者と比べて熟練者が低かった.エントロピーが低ければ,データの複雑性が低いと判断される.そのため,熟練者の動作は,初心者と比べて「円滑さ」,「なめらかさ」など点で優れていることを示唆している.エントロピーと対象者の熟練性との関連について検討した既存研究として,土屋ら(2021)の報告がある.土屋ら(2021)は,基礎看護技術のベッドメイキングの動画活動量を対象として,初心者と熟練者を比較し,熟練者のエントロピーの低さを見出している.ベッドメイキングの動作とプレホスピタル・ケアという大きな場面の相違があるにしても,本研究において熟練者のエントロピーが初心者と比べて低かった事実は,土屋ら(2021)の結果とも一致しており,熟練性の指標の1つとなり得ることを示唆している.

機械学習および線形判別分析による分類性能の評価において,F1値はサポートベクターマシンとランダムフォレストにおいて同等に高かった.この結果は,本研究におけるこれら機械学習の分類性能の高さを示している.金・村上(2006)金・村上(2007)は,文章の書き手の同定を目的として,ランダムフォレストやサポートベクターマシンなど,いくつかの分類法を用いて,F1値を指標に分類性能を比較している.その結果,ランダムフォレストが他の分類法と比べて,分類性能が高かった事実を報告している.金・村上(2006, 2007)の結果と,ランダムフォレストとサポートベクターマシンのF1値が同等であった本研究の結果との不一致は,対象とした課題や分析方法の相違によるものと考えられる.一方で,適合率はサポートベクターマシン,再現率はランダムフォレストが高かった.適合率は初心者と分類されたもののうち初心者の割合を示すため,サポートベクターマシンは,分類されたほぼすべての対象者が初心者であったことを意味する.しかしサポートベクターマシンは,初心者のうち初心者と分類された割合を示す再現率がランダムフォレストに比べて低かった.これは,初心者を熟練者と誤分類する事例が多かった事実を示しており,この点についてはランダムフォレストが優れている.そのため,指導や教育において,初心者を初心者として分類する重要性を考慮すれば,ランダムフォレストの使用が望ましいと考えられる.

ランダムフォレストによる学習における,Gini不純度に基づく変数の重要度の平均値は,10分割した作業時間のうちの3番目,8番目にピークがあり,二峰性の分布を呈していた.そのため,変数の重要度の平均値のピークがあった前半部と後半部に,初心者と熟練者を分類する動作の相違があると考えられる.丹波(2008)によれば,患者接触時のフライトナースの対応として,まず患者状況の全体像を把握しつつ,救急隊とも連携をとり,必要な初療の介助および処置が行われる.そして,患者の状態を評価した上で,搬送先医療機関と搬送手段を医師とともに決定し,患者搬送を行う.このように,変数の重要度の平均値のピークがあった時間には,前半分であれば患者の状況の把握と初療など,後半部であれば,搬送先および手段の決定やその準備などが含まれると考えられる.この点について,Gini不純度に基づく変数の重要度の平均値がピークを示した3番目,8番目の作業時間における動作を比較したところ,3番目においては処置や処置の介助が多く,8番目においては搬送準備が多かった.そのため,初心者と熟練者との分類に重要となる上記時間の動作に対して,教育や訓練などを行えば,熟練者の動作に近づけることができる可能性を示唆している.このようにランダムフォレストには,本研究において分類性能が同等に高かったサポートベクターマシンと比べて,変数の重要度が検討可能な点においても優位性があると考えられる.

以上,本研究においては,プレホスピタル・ケアにおけるフライトナースの動画活動量に基づく,熟練者と初心者の分類可能性について検討した.その結果,動画活動量のエントロピーが熟練性の指標となり得ること,さらには,動画活動量のエントロピーの経時的変化に対して機械学習を適用することにより,高い分類性能を示すことが明らかとなった.これらの結果は,臨床における看護師の熟練性の評価の自動化の一助となると考えられる.そのため,主観の入りやすい人の評価の問題点を解消するばかりでなく,多忙を極める臨床における,教育や業務の省力化,効率化が期待できる.さらに,動画活動量が撮影した動画に基づくことから,その内容を確認すれば対象者の行動や取り巻く環境の詳細が把握できるメリットもある.

本研究の問題点として,動画が主に初心者の教育目的で撮影されたものであるために熟練者の動画が少ないこと,対象事例が30件と十分とは言えないことなどの理由から,これらの要因が機械学習および線形判別分析の分類結果に影響を与えた可能性があること,データのフィルタリングの方法,機械学習のハイパーパラメータ,分類性能の評価方法の妥当性が十分に検証されていないために,研究者の恣意性が入る余地があること,単純に初心者と熟練者の分類可能性を検証したに過ぎないため,熟練の程度まで検討されていないこと,撮影時間がエントロピーへ影響する可能性があること,が挙げられる.今後は,本研究で試みた熟練性評価方法をさまざまな場面,分野等で検討し,広く応用可能性を探索する必要がある.

Ⅴ. 結論

本研究においては,プレホスピタル・ケアにおけるフライトナースの動画活動量に基づく,熟練者と初心者の分類可能性について検討した.その結果,動画活動量のエントロピーが熟練性の指標となり得ること,さらには,エントロピーの経時的変化に対して機械学習を適用することにより,高い分類性能を示すことが明らかとなった.これらの結果は,臨床における看護師の熟練性の評価の自動化の一助となると考えられる.

謝辞:本研究をまとめるにあたり,適切なご助言をいただきました,池谷のぞみ先生(慶應義塾大学文学部),松永伸太朗先生(長野大学企業情報学部企業情報学科),阿久津達矢様(慶應義塾大学大学院文学研究科図書館・情報学専攻博士課程),中澤弘子様(社会医療法人緑泉会米盛病院看護部),安齋勝人様(埼玉医科大学総合医療センター救急科),日本大学大学院総合社会情報研究科眞邉研究室の皆様に心より御礼申し上げます.

利益相反:本研究における利益相反は存在しない.

著者資格:MTは研究の着想および研究デザインの選択,データの入手,分析,解釈に貢献;TSは研究の着想および研究デザインの選択,データの入手,分析,解釈,原稿への示唆に貢献;STは研究の着想および研究デザインの選択,データ分析,解釈,原稿への示唆に貢献;KIは動画活動量算出プログラムの作成およびデータの解釈,原稿への示唆に貢献;KMは,データ分析,解釈,原稿への示唆に貢献,すべての著者は最終原稿を読み,投稿に承認した.

文献
 
© 2021 Japan Academy of Nursing Science
feedback
Top