2024 年 74 巻 1 号 p. 51-58
背景・目的:培養細胞株で認められている細胞内細胞現象(Cell-in-Cell phenomenon: CIC現象)を用いて機械学習(machine learning: ML)の精度とブラックボックス問題について検討した.
対象と方法:機械学習ソフトウェアにおいて,ヒト乳癌細胞株MCF-7の画像データMCF-data1で学習させたNetworkを使用してヒト肺がん細胞株ABC-1の2種類のデータ(ABC-data1とABC-data2)の画像の分類結果を混同行列にまとめ,誤分類画像の特徴について検討した.同一の検証をABC-data1とABC-data2のそれぞれにおいて5回繰り返した.また,学習データにABC-1の画像データを追加した場合における分類結果の検討も併せて行った.
結 果:偽陽性に分類された画像には,画像の背景にフィブリンが多く,フィブリンの無い部分が空隙のように白く抜けてみられるという特徴がみられた.他方,偽陰性に分類された画像では,CICとして外側の細胞に取り込まれた内側の細胞周囲の空隙が不完全なものや,背景のフィブリンの濃淡でフィブリンの網目の間が空隙として多数認められるためにCICの細胞の空隙が目立たない場合がみられた.また,ABC-1の学習データを追加した場合においては,追加前と比較して必ずしも精度が向上するわけではなかった.
結 論:機械学習において,分類のアルゴリズムにはヒトの思考は介在せず,ヒトではなぜ誤分類されるのか理由を推定できない,いわゆる「ブラックボックス問題」が存在する.今回の我々の解析でも明確にどのような理由で誤分類が起きたのかを正しく理解することは難しく,誤分類の理由を形態的特徴と合わせて推定したに過ぎない.今後機械学習を利用する際は必ず理由の理解できない誤分類が起こりえることを念頭に置いておくべきである.