2017 Volume 66 Issue 1 Pages 25-32
顆粒球系幼若細胞分類(骨髄芽球,前骨髄球,骨髄球,後骨髄球)の標準化と技師間差の是正を目的に,日本検査血液学会(JSLH)から公開された細胞画像(基準画像)を利用した内部精度管理(IQC)アプリケーションを開発した。これは検査担当者に基準画像をコンピュータモニタ上で分類させ,JSLHとの一致の程度を定量評価するものである。検査担当者3名を対象とし,細胞分類の結果をIQC実施前後半で比較した。さらに顆粒球系幼若細胞を目視分類した臨床検体を陽性検体と定義し,陽性検体数の検査担当者の違いによる変動(技師間差)をIQC開始前後で比較した。JSLHと担当者の全細胞種を含めた一致度を定量化したCohenのκ係数は,IQC実施後半で有意に上昇した。また細胞別分類一致率は,中央値が100%に近接し,分散は縮小した。さらにIQC開始後,後骨髄球(p < 0.01)を除き,陽性検体数に技師間差を認めなかった。JSLH基準画像を利用したIQCの実施により,細胞分類の正確度と精密度が向上し,顆粒球系幼若細胞分類における技師間差を是正した。本研究は顆粒球系幼若細胞分類の標準化に寄与し,臨床検査値の品質の向上を期待できると結論する。
血液形態検査の目視分類は,検査担当者の主観的判断に依存する1),2)。特に顆粒球系幼若細胞(immature granulocyte;以下IG)は,連続的な成熟過程を分類する難しさから,検査担当者の違いによる変動(技師間差)が顕著である3),4)。坂場ら5)は,2004年度日本臨床検査技師会精度管理調査で出題した前骨髄球の正答施設が90.1%に達している一方で,2012年度医学検査学会の投票カンファレンスで同じ画像を提示した際の正答率が49.3%にとどまったと報告している。これは,外部精度管理でこれまで報告されてきた施設間差以上に,検査担当者間の変動が存在していることを強く示唆している。
血液形態検査の標準化とその普及により,技師間差の縮小が期待できる。本検査の標準化は,1992年に当時のNational Committee for Clinical Laboratory Standards(NCCLS)6)による末梢血液像の基準の提示に始まり,日本では2001年以降,日本検査血液学会(以下JSLH),日本臨床検査医学会および日本臨床衛生検査技師会の共同により進められてきた。JSLHはIG分類の標準化を目的に,“再現性のよい検査結果(分類結果)を得るためには成熟過程の特徴を示したときに分類すること”7)に主眼をおいて各種細胞画像(基準画像)を分類・作成し,2007年に公開した。この基準画像には,編纂に携わった委員間での一致率が付記されており,70%以上の画像を典型的な同定細胞と定義している。
血液形態検査の内部精度管理(IQC)として,同一標本を供覧し,施設内の基準担当者に他の担当者の判別基準を合わせる,いわゆる“目合わせ”が行われている3)。この方法は施設内精度の向上を期待できる一方,基準担当者の正確度を客観的に保証する仕組みがない。また現在のIQCによる技師間差の是正効果を,他の形態検査分野8)のように臨床検査値で検証した報告はこれまでない。
我々はIGのJSLH基準画像を用いたIQCアプリケーションを開発した。基準画像を検査担当者にコンピュータモニタ上で分類させることにより,JSLH基準に対して目合わせ(校正)を行っていることと等価となる。本研究は,JSLH基準画像を活用したIQCの実施により,IG分類の正確度および精密度が改善することを示す。さらに臨床検査値に含まれる技師間差を改善することを示す。
IG(骨髄芽球,前骨髄球,骨髄球,後骨髄球)各50細胞の画像(基準画像;合計200画像)を,JSLH Webサイト(http://www.jslh.com)からダウンロードした。収集した基準画像は,JSLH委員間の分類一致率が70%以上のものとした。
2. システム構成と動作アプリケーションはMicrosoft ACCESS 2013(Microsoft)を用いて開発した。コンピュータモニタ上に細胞画像を1画像毎に表示し,検査担当者に分類させた(Figure 1A)。基準画像セットは,ダウンロードした画像から各種細胞を最低5つ含む条件でランダムに抽出して,IQC実施日ごとに自動作成した(Figure 1B)。回答結果は,Cell by cellで回答の正誤と回答細胞名を表示し,検査担当者間で比較できるようにした(Figure 1C)。
血液形態検査内部精度管理アプリケーション
(A)細胞分類画面(B)JSLH基準画像200画像から,各細胞を少なくとも5つ含むように画像をランダム抽出。担当者の分類結果を分析・評価する。(C)担当者へのフィードバック例。細胞毎に担当者の正否を比較。誤回答の記録とその細胞画像を参照できる。
対象は,3名の血液検査担当者とした(検査担当歴A:14ヶ月,B:50ヶ月,C:42ヶ月)。IQCを2015年8月25日から2015年11月3日までの70日間実施した。IQC実施期間を前後半35日間に分けて,回答結果を分析した。担当者毎のIQC実施回数nは,前半がnA = 8,nB = 12,nC = 19,後半がnA = 13,nB = 9,nC = 16であった。JSLHと担当者間の全細胞種を含めた一致度を,Cohenのκ係数で評価した。またJSLHと担当者間の細胞別分類一致率および担当者の回答内訳を集計した。回答内訳は,細胞別合計出題数に対する割合として集計した。
4. 臨床検体の集計IGを目視分類した臨床検体を陽性検体とし,目視検体数に対する陽性検体数の割合を陽性検体率とした。IQC開始前の2014年6月1日から2015年5月31日までの1年間(期間I:n = 21,451)と,IQC開始直前の2015年6月17日から8月25日までの10週間(期間II:n = 3,125)および開始直後の2015年8月26日から11月3日までの10週間(期間III:n = 3,639)の3群で陽性検体率を比較した。なお本研究は,侵襲及び介入を伴わず,人体から取得された試料を用いない研究であるため,倫理委員会の承認を得ていない。
5. 技師間差の分析診療科別陽性検体率(P)と診療科別目視検体数(C)から,陽性検体数の期待値(E)を次式として定義した。
h:検査担当者,i:診療科,j:細胞種
期待値(E)と陽性検体数(O)を担当者毎に算出し,担当者の違いによる変動(技師間差)の有無を細胞毎に検討した。また期待値と陽性検体数の差の指標(D)を下式のように定義した。
h:検査担当者,j:細胞種
担当者3名のD値を細胞毎に合計した値は,その細胞におけるχ2値となる。合計D値が5.99(自由度2,有意水準5%のときのχ2値)を超過するかどうかを指標とし,IQC開始前後のD値の変化を検討した。
6. 統計処理統計処理はR version 3.2.3で行った。Cohenのκ係数および細胞別分類一致率の解析は,中央値をWilcoxonの順位和検定,分散をF検定で行った。陽性検体率の解析は,p値をBenjamini & Hochberg法で調整したFisherの正確確率検定による多重比較を行った。技師間差の有無はχ2検定で検討した。
JSLHと担当者間の全細胞種を含めた一致度をCohenのκ係数で定量評価した(Figure 2)。IQC前半と比較して後半で,κ係数の中央値はすべての担当者で有意に上昇した(A: 0.86 vs 0.96, B: 0.87 vs 0.96, C: 0.95 vs 1.00)。
Cohenのκ係数による比較
IQC前後半各35日間におけるCohenのκ係数の中央値をWilcoxonの順位和検定で解析した。担当者毎のIQC実施回数nは,前半がnA = 8,nB = 12,nC = 19,後半がnA = 13,nB = 9,nC = 16であった。(*: p < 0.05, **: p < 0.01)
担当者が回答した細胞の内訳を集計した(Table 1)。IQC前半でJSLHと異なる細胞に5%以上分類した例は,前骨髄球を骨髄球に分類した例でA(9.1%),B(13.1%),C(7.3%),骨髄球を後骨髄球に分類した例でA(6.0%),B(9.7%),骨髄球を前骨髄球に分類した例でA(11.2%),C(6.6%)であった。IQC後半では,骨髄球を前骨髄球に分類した例のA(12.1%)のみであった。
担当者毎の細胞分類の内訳
担当者 | JSLH | |||
---|---|---|---|---|
骨髄芽球 | 前骨髄球 | 骨髄球 | 後骨髄球 | |
A 出題数(n) | 70 | 65 | 73 | 65 |
分類割合(%) | ||||
骨髄芽球 | 99.1 | 0.5 | ||
前骨髄球 | 90.4 | 11.2 | ||
骨髄球 | 9.1 | 82.8 | 3.9 | |
後骨髄球 | 6.0 | 96.1 | ||
その他 | 0.9 | |||
B 出題数(n) | 102 | 101 | 104 | 104 |
分類割合(%) | ||||
骨髄芽球 | 97.8 | 0.5 | ||
前骨髄球 | 85.2 | 1.7 | ||
骨髄球 | 0.5 | 13.1 | 88.6 | 2.9 |
後骨髄球 | 1.1 | 9.7 | 97.1 | |
その他 | 1.6 | |||
C 出題数(n) | 171 | 165 | 166 | 151 |
分類割合(%) | ||||
骨髄芽球 | 99.4 | 0.6 | ||
前骨髄球 | 91.5 | 6.6 | ||
骨髄球 | 7.3 | 91.0 | 2.0 | |
後骨髄球 | 0.6 | 2.4 | 98.0 | |
その他 | 0.6 |
担当者 | JSLH | |||
---|---|---|---|---|
骨髄芽球 | 前骨髄球 | 骨髄球 | 後骨髄球 | |
A 出題数(n) | 105 | 108 | 124 | 96 |
分類割合(%) | ||||
骨髄芽球 | 100.0 | |||
前骨髄球 | 97.2 | 12.1 | ||
骨髄球 | 2.8 | 87.1 | ||
後骨髄球 | 0.8 | 100.0 | ||
その他 | ||||
B 出題数(n) | 84 | 82 | 72 | 66 |
分類割合(%) | ||||
骨髄芽球 | 100.0 | 1.2 | ||
前骨髄球 | 93.9 | 1.4 | ||
骨髄球 | 4.9 | 94.4 | 1.5 | |
後骨髄球 | 4.2 | 98.5 | ||
その他 | ||||
C 出題数(n) | 134 | 142 | 133 | 124 |
分類割合(%) | ||||
骨髄芽球 | 99.3 | |||
前骨髄球 | 98.6 | 0.8 | ||
骨髄球 | 1.4 | 99.2 | ||
後骨髄球 | 100.0 | |||
その他 | 0.7 |
担当者毎の細胞分類の内訳について,IQC前後半各35日間で細胞別合計出題数(n)に対する担当者毎の分類割合(%)を集計した。集計値は少数第2位以下を切捨てた。
JSLHと担当者間の細胞別分類一致率のIQC前後半における変化を検討した(Figure 3)。骨髄芽球では前後半とも分類一致率の中央値は全ての担当者で100%であったが,AとBで分散の縮小を認めた。前骨髄球ではAとCに中央値の上昇,全ての担当者で分散の縮小を認めた。骨髄球ではCで中央値の上昇,全ての担当者で分散の縮小を認めた。後骨髄球では前後半とも分類一致率の中央値は全ての担当者で100%であったが,AとCで分散の縮小を認めた。
細胞別分類一致率の評価
細胞別の分類一致率を担当者別にIQC前後半各35日間で比較した。分類一致率の中央値はWilcoxonの順位和検定(*: p < 0.05, **: p < 0.01),分散についてF検定(†: p < 0.05, ††: p < 0.01)で改善の有無を検討した。担当者毎のIQC実施回数nは,前半がnA = 8,nB = 12,nC = 19,後半がnA = 13,nB = 9,nC = 16であった。(N.S.: Not Significance)
IQC開始後の陽性検体率の変化を検討した(Figure 4)。期間IとII(いずれもIQC開始前)との間で,すべての細胞で陽性検体率に統計的有意差を認めなかった。一方,期間IとIII(IQC開始後)との間では,すべての細胞で陽性検体率に統計的有意差(p < 0.01)を認めた。陽性検体率は骨髄芽球(2.6% vs 3.9%),前骨髄球(1.8% vs 3.0%)と骨髄球(19.2% vs 23.5%)で増加,後骨髄球(37.9% vs 33.5%)で減少した。
陽性検体率の変化
各期間(I:IQC開始前1年間:n = 21,451,II:IQC開始直前10週間:n = 3,125,III:IQC開始直後10週間:n = 3,639)の陽性検体率を集計した。p値をBenjamini & Hochberg法で調整したFisherの正確確率検定により各群の陽性検体率を多重比較した。(*: p < 0.05, **: p < 0.01, N.S.: Not Significance)
陽性検体数に技師間差があるかを検証した(Table 2)。IQC開始前は,前骨髄球(p < 0.05),骨髄球(p < 0.01),後骨髄球(p < 0.05)で担当者の違いによる変動を認めたが,IQC開始後では後骨髄球(p < 0.01)を除いて統計的有意差を認めなかった。
細胞種別 | 担当者 | 集計期間II(n = 3,125) | 集計期間III(n = 3,639) | ||||||||
---|---|---|---|---|---|---|---|---|---|---|---|
合計 | E | O | 陽性率(%) | p値 | 合計 | E | O | 陽性率(%) | p値 | ||
骨髄芽球 | A | 1,054 | 33 | 43 | 4 | 0.25 | 1,159 | 46 | 55 | 5 | 0.29 |
B | 1,130 | 32 | 23 | 2 | 1,614 | 61 | 48 | 3 | |||
C | 941 | 31 | 31 | 3 | 866 | 35 | 38 | 4 | |||
前骨髄球 | A | 1,054 | 22 | 36 | 3 | <0.05 | 1,159 | 34 | 45 | 4 | 0.26 |
B | 1,130 | 22 | 11 | 1 | 1,614 | 49 | 39 | 2 | |||
C | 941 | 19 | 16 | 2 | 866 | 26 | 25 | 3 | |||
骨髄球 | A | 1,054 | 211 | 280 | 27 | <0.01 | 1,159 | 270 | 296 | 26 | 0.37 |
B | 1,130 | 237 | 182 | 16 | 1,614 | 389 | 379 | 23 | |||
C | 941 | 176 | 162 | 17 | 866 | 196 | 180 | 21 | |||
後骨髄球 | A | 1,054 | 393 | 450 | 43 | <0.05 | 1,159 | 379 | 429 | 37 | <0.01 |
B | 1,130 | 449 | 396 | 35 | 1,614 | 555 | 478 | 30 | |||
C | 941 | 327 | 323 | 34 | 866 | 284 | 311 | 36 |
各期間(II:IQC開始直前10週間,III:IQC開始直後10週間)の陽性検体数とその期待値を集計した。技師間差の有無を,χ2検定により評価し,期間IIとIIIで比較した。(E:陽性検体数の期待値,O:陽性検体数)
IQC開始前後における期待値から臨床検査値の変動をD値で評価した(Figure 5)。各細胞におけるD値の合計は,骨髄芽球で期間IIの5.6(A: 2.8, B: 2.7, C: 0.0)から期間IIIの4.9(A: 2.0, B: 2.7, C: 0.3),前骨髄球では15.5(A: 9.3, B: 5.7, C: 0.4)から5.7(A: 3.5, B: 2.2, C: 0.0),骨髄球では36.8(A: 22.8, B: 12.9, C: 1.1)から4.0(A: 2.5, B: 0.2, C: 1.3)に減少し,すべて5.99(自由度2,5%有意水準のχ2値)を下回った。一方後骨髄球では,14.5(A: 8.2, B: 6.2, C: 0.1)から19.9(A: 6.5, B: 10.7, C: 2.6)に増加した。
陽性検体数とその期待値の差の変化
各期間(II:IQC開始直前10週間,III:IQC開始直後10週間)の陽性検体数とその期待値の差(D値)を算出した。D値をD = (O − E)2/Eと定義し,期間IIとIIIで比較した。(E:陽性検体数の期待値,O:陽性検体数)
JSLH基準画像を用いたIGのIQCアプリケーションを開発し,日常検査に応用した。JSLH基準画像によるIQCを実施したことにより,JSLHとの全細胞種を含めた一致度が全ての担当者で上昇した。細胞別分類一致率について,中央値の上昇,分散の縮小傾向を認めた。さらに細胞別陽性検体数における技師間差は,後骨髄球を除いて統計学的に検出できない程度にまで改善した。
当院では,IQCアプリケーション導入前は他施設同様に同一標本の供覧による目合わせを毎月行ってきた。しかし,実際には技師間で臨床検査値は変動していた(Figure 2, Table 1, 2)。これは供覧に使用する症例数が少ない場合,あるいは分類頻度の少ない細胞では,技師間差の有無を正しく評価できないことが原因であると考える。したがって様々な成熟段階にある十分な数の細胞を分類し,その結果を比較・検討を行わない限りは,技師間差を是正する効果が弱い。
IQC前半では,前骨髄球と骨髄球で分類一致率の中央値は低く,分散は大きかった。IQC実施前の臨床検査値においても,両細胞に技師間差を認めた。一方,後骨髄球では,IQCでの分類一致率が高かったにも関わらず,実際の臨床検査値で技師間差を認めた。これは後骨髄球と桿状核球の識別がIQCで問われていないことが原因であると考える。すなわちIQCでは回答の選択肢がIG4種に限られており,後骨髄球と桿状核球の識別のための目合わせが行われなかった結果,IQCと臨床検査値との間に乖離が生じたと考える。今後,本アプリケーションに桿状核球および分葉核球を含めた検討を行う必要がある。
血液像自動分析システムCellaVision DM96(セラビジョン;以下DM96)の導入により,血液像目視検査を自動化する取り組みが行われている9)~11)。DM96の白血球分類能は,Briggsら12)による検査技師との分類一致率の比較検討で好酸球と好塩基球について80%を下回っていたが,山本ら11)の報告ではいずれの細胞種も80%を超えたとしている。一方で,LeeやBriggsら9),12)は,IGの目視検査との相関係数は低いと報告している。Briggsら12)は,DM96の性能は検査技師と同程度だが,DM96を扱う担当者は,形態学のスキルが必要であると結論している。すなわち正常5分類以外の細胞について,検査担当者の識別能力の重要性は現在も変わらないことを,これらの報告は示唆しており,日常検査で観察機会の多いIGは,検査担当者の定量的なIQCが重要である。
血液形態検査の精度管理にバーチャルスライド13)やDM96付属の教育ツールであるCellaVision Competency Softwareの利用が試みられている3),14)。コンピュータモニタ上で細胞分類を行い,Cell by cellで担当者間の結果を比較可能な点が塗抹標本を光学顕微鏡下で分類する従来の方法よりも優れている。一方,施設内基準担当者が分類した自施設の細胞画像を利用している現状では,施設内差の縮小を期待できる一方で,施設間差の是正につながるかは検討が必要である。桿状核球と分葉核球の日本臨床検査技師会・日本検査血液学会の新分類基準の検証を目的に行われたバーチャルスライドを用いた多施設間比較15)と同様に,IGについても多数のJSLH基準画像あるいは検定済みのバーチャルスライドを用いた定量的な検討が望まれる。
我々はJSLH基準画像に検査担当者の目合わせ(校正)をすることで検査室内の識別基準をJSLH基準に標準化できるシステムを構築した。本アプリケーションの活用は,検査室内の顆粒球系幼若細胞分類を標準化し,臨床検査値の品質を向上させることができたと結論する。
本論文に関連し,開示すべきCOI 状態にある企業等はありません。