産業衛生学雑誌
Online ISSN : 1349-533X
Print ISSN : 1341-0725
ISSN-L : 1341-0725
短報
産業保健におけるDeep Learningの活用:物流企業の職場巡視画像を用いたパイロット研究
内田 満夫野下 浩司筒井 保博小山 洋
著者情報
ジャーナル フリー HTML

2018 年 60 巻 6 号 p. 191-195

詳細

目的

近年わが国では,少子高齢化による労働者人口の減少,転職の活性化や派遣業の拡大により労働形態の多様化を認める1).さらに高年齢者の雇用対策2),働き方改革3)など,時代に応じた新しい働き方を認め,より柔軟な安全衛生活動が求められている.しかし以前より,わが国の労働災害の減少率が鈍化傾向にあること,熟練社員の退職によりノウハウが継承されず安全管理を担う人材不足が危惧されていること,産業の高度化などに伴い多様化するリスクに十分対応できないこと等の課題が存在し,事業場における新しい安全衛生管理が必要とされてきた4).さらには,平成29年の労働災害発生状況の総数を見ると,前年と比較して死亡件数は5.4%,休業4日以上の死傷災害は2.2%増加しており5),今後も継続的な労働災害の予防の取り組みが必要とされている6)

これらと並行して,コンピュータ技術の発達とともに,2010年ころより第3次人工知能(Artificial Intelligence:AI)ブームが沸き起こり,インターネットの検索エンジンやスマートフォンの音声応答など,私たちの生活の身近なところに浸透し始めている7).特に,AIの主要構成要素である「Deep Learning(深層学習)」は,人の脳の神経細胞を模倣したニューラルネットワーク構造をより深い階層によって表現した技術であり8),ヒトの視覚や聴覚を補う技術として広く活用されている.画像解析を得意とする深層学習は,医師の視覚を必要とする技術と親和性が高く,医学研究では画像解析診断学領域で使用され始めた9-11).臨床医学現場でもその有用性が認められ,わが国の重点課題として推進される傾向にある12).これらと同様に,産業保健分野でも熟練者の視覚による評価や判定が重要な役割を果たしている.したがって産業保健分野にも人工知能の活用が期待されるが13),しかしながら,2018年6月時点で,同分野における深層学習の議論や研究は国内外ともに乏しい.

以上より,労災の予防が喫緊の課題である現在,わが国の安全衛生活動の推進のために,新たな手法である深層学習の可能性を知ることが必要である.わが国の産業保健現場で深層学習の報告が乏しいのは,有用性について認識しながらも,深層学習を用いて具体的にどのような研究ができるのか不明瞭であったためと推察される.本報告は,職場巡視で得た画像を用いて,産業保健分野における深層学習の可能性を探ることを目的とした.

対象と方法

画像データの収集

2018年3月と4月に,群馬県の物流企業1社において職場巡視をおこなった.今回は作業通路の床面を対象に,4S(整理,整頓,清掃,清潔)の状況の良否を判定した.深層学習では,多量のデータを機械学習させ,専門家の達観による分類を画像認識技術で模倣することが可能となっている.このたび研究者は,職場巡視の際に床面の画像を撮影しながら,作業通路に物が置かれていないか,通路を移動するキャリアやパレットが整頓されているか,また不要なゴミなどがないか評価し,問題なければ良好,それ以外は要改善,と2種類の判定をおこなった.撮影条件をそろえるため,全ての画像を研究者一人が同じデジタルカメラを使用し,対象の撮影距離は5 mにおさめ,また午後に撮影という条件で60枚の画像を収集した.

深層学習の方法

職場巡視で得られた物流業の床面の画像60枚を,研究者の判定に基づき良好群27枚と要改善群33枚に2分し,画像データと判定区分を紐づけする教師あり学習を実施した(図1).学習におけるコンピュータスペックはCPUがCore i7,メモリが8GB,使用言語はPython3.6(ver. 5.1.0)8)を用いた.深層学習ライブラリは,世界的に普及しているオープンソースのTensorFlowとTensorBoard(Google,CA,USA)を用いた14).画像を学習するネットワークは,畳み込みニューラルネットワーク(Convolutional Neural Network:CNN)を用いた8,15).このCNNは,画像に特徴的な輪郭やパターンを探しながら単純化していく手法であり,画像認識のアプリケーションにおいて最も使用されているモデルである16).CNNのプログラムは,その目的に応じて条件を探索しながら研究者が学習ネットワークを構築するため,標準的なパラメータの数値は確立されていない.このたびの研究では,各種パラメータはTensorFlowのデフォルト設定をベースにし,公開されているチュートリアル15)に沿って修正し,また適宜アレンジしながら決定した.その結果画像は224×224ピクセル,フィルターは5×5ピクセルとした.CNNの中間層は4層,活性化関数は中間層がRelu関数,出力層はSoftmax関数を使用した.学習バッチ数は64,エポック数は30,最適化は確率的勾配降下法,損失関数はCross entropy error法で評価した.

深層学習では大量のデータが必要なため,手持ちのデータが少ない場合は画像処理して増幅させることが一般的である.このたび撮影した画像は明度,彩度,コントラスト,画像角度の5度と10度の回転,左右反転により処理をおこない,オリジナルの画像60枚から処理後の画像4810枚に増加させた.全ての画像のうち,ランダムに20%をテストデータとして予め抽出し,残りを訓練データとして学習ネットワークを構築した.その後,構築したネットワークに,改めてテストデータを読み込み良好/要改善を判定させ,研究者が先にラベルした正解結果との一致割合を評価した(学習精度100%とは,研究者が判定したテストデータの良好/要改善ラベルを,学習ネットワークが全て的中させることを意味する).

図1.

教師あり学習のイメージ

研究者が職場巡視で得た画像を「良好」と「要改善」に2分して,それぞれの画像と判定結果を紐づけした.そのデータセットから画像の特徴をコンピュータが学習して,学習ネットワークを構築した.

研究倫理

本研究は,人を対象とした個人情報が発生する研究ではなく,職場施設の床面を評価する研究のため,倫理審査は不要と判断した.

結果

今回の研究では,研究者による床面の安全衛生の判定と,構築した学習ネットワークによる判定の一致割合を10回にわたって評価した.その結果,最低で60%,最高で95%を示した.最も精度の高い学習ネットワークを構築したときの学習プロセスを図2に示す.本研究で使用したコンピュータでは,学習ネットワークを構築するのに,1回あたり約8時間を要した.

図2.

学習精度の向上

TensorBoard 14)を利用すると,学習プロセスを視覚的に表現することが可能である.今回の研究では,最高で95%の一致割合を示した.X軸はトレーニングステップ(画像を数値データに変換して推定した良否の判定結果と,実際の判定結果の誤差を少なくするために繰り返される計算の回数),Y軸は学習精度(判定の一致割合)を表している.

考察と結論

本パイロット研究は,安定的な労働力を確保することが難しい現代のわが国において,持続的な安全衛生活動を推進するため,AI技術を安全衛生活動の補助的ツールにすることを視野に入れて開始した.本研究では,まず職場巡視で撮影した画像という身近なデータを用いて,研究者による安全衛生の判定と,深層学習で構築した学習ネットワークによる判定の一致割合を検討した.その結果,職場巡視においてAIのサポートの有用性を示唆する結果が得られた.

本研究で使用したCNNは,画像を単純化すると同時に特徴のある輪郭等を探し出す手法である.今回は4Sをテーマとして研究者が良否を分類したが,深層学習はそこから物品の配置や整列状態の違いを,また不要物の存在や著しい汚れの有無などを画像の特徴量として認識している.したがって,私たち産業保健従事者が職場巡視を実践する際に良否を判断する材料は画像で視覚化できる部分があり,専門家の技術に深層学習を適用することが可能であると推測される.ただし,床面の4S以外のデータは本研究で評価されていないため,引き続きCNNの適用範囲について検討することが必要である.

今回の研究では,深層学習による学習精度はネットワークを構築するたびに異なり,最低60%から最高95%と幅を認めた.本研究では職場巡視画像を用いるという新たな試みであるため,学習精度が十分であると判断できる閾値は存在しないが,その値は100%に近いほどよいネットワークであるといえる.しかし,良否の判定という2値のアウトカムであることを考慮すると,ランダムに回答(50%)するよりは一貫して高かった,という結果に留まる.学習精度に幅を認めたのは,元の画像枚数が少ないこと,またパラメータ設定に改善の余地があることが推察される.したがって現段階では,本パイロット研究は現場での実用に直結するものではない.今後は画像データのバリエーションを増やして高い学習精度を示すモデルを構築し,さらに頑健性と汎化性を高めていくことが求められる.

わが国でAI研究を推進するためには,この研究テーマに興味を持つ研究者が議論を活性化させ,基礎的な研究を積み重ねることが必要である.しかし現在のところ産業保健分野における深層学習に関する研究は不足している.したがって,まず本パイロット研究を短報で報告することとした.ここでは,産業保健分野においてAIの研究報告が少ない理由を考察せねばならない.筆者らの考えでは以下の3点が推察された.

①一般的な仮説検定に基づく因果関係の推定と異なる研究手法であること:開発系の研究は,そのツールの信頼性や妥当性の評価が求められるため,因果推定の研究とは手法が異なる.AI研究は目的によりアウトカムの表現方法は多様であるが,本研究では深層学習によりヒトの判定を模倣することが目的であるため,判定を的中させる割合という単一の指標で結果を示した.現在のところ,この割合を「学習精度」として表現することで,学習ネットワークの信頼性を示すことができる15).今後はこの精度を向上させることが,産業保健における深層学習研究の目標の一つとなるだろう.

②深層学習の方法が煩雑で理解しにくいというテクニカルな問題が存在すること:深層学習にはコンピュータが必須であり,条件を設定するためには少々のプログラミングスキルが要求される.今回使用したPython3は初学者向きの言語としてその地位を確立しており,多くの研究者が比較的取り掛かりやすいと考えられる.

③AIに対する過度の期待と誤認があること:AIにおける深層学習の技術は,その仕組みを見てみると,観察データと推定関数の誤差が最も少なくなるところを探す方法,と理解することができる.メディアでは,人にとって代わる夢の技術であるかのような表現を散見するが,今のところは決してそのような技術でない.我々研究者がAIを正しく認識することで,適切に利用することが可能となる.

本研究は,これらの3点をクリアしたことに意義があると考えられる.今後多くの研究が行われ,基礎的研究データが蓄積されると,次は実用化の検討とルールの整備が必要となるだろう.本学会において,遠からず産業保健とAIに関する活発な議論が始まり,必然的にルールの整備も始まると予想される.また産業保健でAIを活用するとしても,安全衛生という性格上「運用上の責任は人に帰属する」ことを留意しなければならない.

本研究の限界は,まず教師あり学習につながる研究者の判定が定量評価に基づいていないことである.臨床医学研究では,特定の評価尺度に基づく得点のカットオフポイントからROCカーブを描き,人とAIの判定精度を比較している9,11).産業保健において,職場画像の定量化は,チェックシートや点数票を用いることで克服できる可能性もあるが,場面の異なる画像1枚ずつに画一的な評価をすることは困難な場合もある.今回は研究者の経験に基づき,良否という2値で判断することとした.次に,画像を処理して枚数を増加させたため,学習ネットワークがデータセットに依存する“過学習”の問題がある.これは,今回の結果が変動することからも,その影響が疑われる.引き続きデータを収集して多様な場面を学習させることで制御することが可能となる.これらを解決するため,今後の研究のテーマとして設定することが必要である.

以上より,産業保健分野において深層学習の技術を活用することは可能であると考えられる.今後AIは,高年齢労働者の増加や働き方の多様化する労働現場において,安全衛生の取り組みを補完する技術として応用できる可能性が高い.今後は技術開発だけでなくルールも整備することで,将来的にAIは安全衛生活動のよきサポーターとなることが期待される.

本研究の一部は,第91回日本産業衛生学会(熊本,2018)で発表した.

利益相反

内田満夫は本研究でデータを収集したトラスコ中山株式会社と嘱託産業医契約を結んでいる.

文献
 
© 2018 公益社団法人 日本産業衛生学会
feedback
Top