Japanese Journal of Medical Technology
Online ISSN : 2188-5346
Print ISSN : 0915-8669
ISSN-L : 0915-8669
Technical Article
Detection of latent cancer in prostate biopsy using Paige Prostate® (prostate pathology diagnostic support artificial intelligence; AI): Revaluation of diagnostic accuracy based on Japan’s first trial experience
Naruaki MATSUIMayuka MATSUNOYuki ODAKATomomi SAKIYAMAHiroshi KAJIWARANaoya NAKAMURARie IRIEYoshiyuki R OSAMURA
Author information
JOURNAL FREE ACCESS FULL-TEXT HTML

2025 Volume 74 Issue 2 Pages 331-339

Details
Abstract

アメリカ食品医薬局(FDA)は前立腺生検に含まれる潜在癌を画像上で特定するartificial intelligence(AI)のPaige Prostate®(Paige.US)を承認した。われわれは本システムの試用機会を得たのでその検出精度を評価した。対象は患者10例,108生検を用いPaige Prostateの解析結果とヒトによるHE染色診断の結果を1)生検数(本数)からみた診断率,2)癌領域の検出数,3)Gleason patternからみたPaige Prostateとヒトの一致率,4)Paige Prostateの解析再現性を評価した。Paige Prostateの診断率は感度100%,特異度82.3%。癌領域の見落としはなかった。また,ヒトが検出し得なかった2つの癌領域を指摘する一方で良性腺管や正常間質を過剰(75領域)に検出していた。Gleason patternからみたPaige Prostateとヒトとの一致率は,一致が64.7%(44/68領域:Pattern 3,4),不一致が35.3%(24/68領域:Pattern 4糸球体様構造,Pattern 5印環様細胞亜型)であり,稀な組織亜型を誤認識する傾向がみられた。Paige Prostateは癌領域の見落としがないシステムであるが,非癌領域と稀な組織亜型に対する更なる深層学習がより診断精度の高い病理診断AIに繋がるものと考える。

Translated Abstract

The U.S. Food and Drug Administration (FDA) has approved Paige Prostate (Paige.US), an artificial intelligence (AI) technology that uses images to identify the area most likely to contain occult cancer in prostate biopsies. We evaluated the diagnostic accuracy of this system for detecting prostate cancer. The subjects were 108 biopsies from 10 patients with cancers, and the results of Paige Prostate analysis and HE staining diagnosis by humans were evaluated to determine: 1) Prostate’s biopsy diagnostic accuracy, 2) number of detected cancer areas, 3) Gleason pattern, and 4) reproducibility of the analysis. Prostate’s biopsy by Paige Prostate diagnostic accuracy is 100% sensitive and 82.3% specific. The concordance rate between Paige Prostate and human microscopic observation on Gleason pattern was 64.7% (44/68 areas: Patterns 3 and 4), whereas the concordance rate was 35.3% (24/68 areas: Pattern 4 glomerular-like structure, Pattern 5 signet ring cell subtype), indicating a tendency to misrecognize rare histological subtypes. Paige Prostate is a useful system that does not overlook cancer areas, In the future, further learning in non-cancerous areas and rare histological subtype areas will lead to practically useful pathological diagnosis AI with higher diagnostic accuracy.

I  はじめに

医療分野における人工知能(artificial intelligence; AI)の応用は,医療技術の革新的な発展を促進させ,患者の診断や治療をより効果的に行うことを可能とした1)~9)。近年では病理診断分野にも活用され,病理医がスキルや経験に依存することなく,病理診断の人為的エラーを軽減する役割まで担いつつある。さらに診断速度や正確性の向上に加え,治療効果の評価に対する応用にも期待がもたれている。

アメリカ食品医薬局(U.S. Food and Drug Administration; U.S. FDA)は,2021年9月に前立腺生検において潜在癌の可能性が最も高い領域を画像上特定するAIのPaige Prostate®(Paige.US)(以下,Paige)を承認した10)。本診断システムは,1万5,187例,4万4,732枚のスライド画像データ(前立腺癌,皮膚癌および乳癌)の深層学習情報から前立腺潜在癌を検出することに特化している。Paigeによる潜在癌の検出方法は,前立腺生検内に含まれる癌領域を指摘し,この領域に含まれるGleason patternを3,4,5のそれぞれに振り分ける11)Figure 1)。われわれは本システムの試用機会を得たのでその検出精度を評価した。

Figure 1  Performance of Paige Prostate (For cases with a Gleason score 3 + 4)

A method for detecting latent cancer using Paige Prostate® (Paige.US).

Detect the entire cancer area in the biopsy (a) and classify the areas of Gleason pattern 3 (b) and 4 (c) within the cancer area.

II  対象と方法

患者10名から採取された108生検試料に対して10%中性緩衝ホルマリン固定後のパラフィン包埋ブロックから薄切された未染標本をHematoxylin Eosin染色(以下,HE染色)にて染色した。これらの標本を用いて1)判定者3名(病理専門医2名,病理専門臨床検査技師1名)で構成されるグループが,HE染色標本内にみられる癌領域を顕微鏡下で直接スライドガラスにマーキング,2)マーキングしたHE染色標本をバーチャルスライドスキャナー(Nano Zoomer S210:浜松フォトニクス)にてデジタル画像化,3)デジタル化した画像をPaigeにて解析した(Figure 2A)。

Figure 2  A method for detecting latent cancer using Paige Prostate

[A] (a) The cancer area detected microscopically in the HE-stained specimen was directly marked on the slide glass.

  (b) The marked HE-stained specimen was digitally imaged using a virtual slide scanner (Nano Zoomer S210: Hamamatsu Photonics).

  (c) The digitalized image was analyzed using Paige Prostate (Paige Prostate, Paige.US). The areas of cancers are marked in red.

[B] (a) The cancer area detected microscopically in the HE stained specimen was directly marked on the glass slide (red underline).

  (b) Paige Prostate pointed out the cancer area in the digitally imaged HE stained specimen (red area is the cancer).

  (c) For the final evaluation of the Paige Prostate analysis results and the human judgment results for the cancer area, the expression results of immunohistochemical staining (double staining: p504s + CK34βE12, 4A4: AMACR) were used to determine the exact tumor gland duct area.

Paigeの解析結果とヒトによる判定結果の評価には,パラフィン包埋ブロック薄切時にHE染色用切片に次ぐ連続薄切を用い酵素抗体法にて判定した。1次抗体としてp504s(SP116)(赤発色:alkaline phosphatase; AP)+Basal Cell Cocktail [HMW Keratin + p63](34βE12, 4A4)(茶発色:3,3'-diaminobenzidine tetrahydrochloride; DAB)(以下,AMACR)を用いて2重染色を実施し,腫瘍細胞が赤色発色を示し且つ,筋上皮細胞(茶色発色)への発現を欠く部位を正確な癌領域と判断した(Figure 2B)。

これらの方法にて得られた情報からPaigeの解析結果とヒトによるHE染色診断の結果を1)生検数(本数)からみた診断率,2)癌領域の検出数,3)Gleason patternからみたPaigeとヒトの一致率,4)Paigeにおける解析の再現性について評価した。

III  結果

1. 生検数(本数)からみた診断率の評価

前立腺生検108試料のうち癌領域を検出した生検数Paige:57本/ヒト:46本/免疫組織化学染色:46本であった。Paigeとヒトが癌領域ありと判定した生検内には全ての潜在癌が含まれる一方,Paigeでは癌領域を含まない11生検を過剰に検出していた(Paige:感度100%,特異度82.3%,ヒト:感度100%,特異度100%)(Table 1)。

Table 1 Evaluation of biopsy diagnostic accuracy

Number of positive biopsy
PP 57 (11 overdetection)
H 46
Number of AMACR detection biopsy 46
PP vs AMACR
sensitivity 100.0%
specificity 82.3%

Evaluation of 108 biopsy samples from 10 patients.

PP: Paige Prostate

H: Human

AMACR: Immunohistochemical stain

2. 癌領域の検出数

Paige:143領域/ヒト:66領域/AMACR:68領域であった。PaigeとAMACRの一致率は47.9%(Paige:143領域/AMACR:68領域)。Paigeは全ての癌領域を検出する一方で75領域を過剰に検出(良性腺管および萎縮腺管:23領域,正常間質:52領域)していた(Figure 3, Table 2)。また,生検1本に含まれる過剰検出領域は1~7領域までみられたが,その多くは1~3領域に留まっていた(Figure 4)。一方,ヒトとAMACRの一致率は97.1%(ヒト:66領域/AMACR:68領域)。ヒトは2ヶ所の癌領域を指摘し得ていなかった(Figure 5)。

Figure 3  All areas detected by Paige Prostate

Paige Prostate detected all cancer areas pattern 3, 4. On the other hand, 75 areas were overdetected by Paige Prostate (23 areas: benign ducts, 52 areas: normal stroma).

Table 2 Number of tumor duct detection areas

Number of tumor duct detection areas Match rate with AMACR
PP 143 (75 overdetection) 47.9%
H 66 (2 underdetection) 97.1%
Number of AMACR detection areas: 68

PP: Paige Prostate

H: Human

AMACR: Immunohistochemical stain

Figure 4  Evaluation of reproducibility by Paige Prostate

The number of overdetected areas included in the biopsies ranged from 1 to 7 areas, However, in many cases, the number of overdetected areas within one biopsy fragment was limited to 1 to 3 areas.

Figure 5  Example of different results between Human and Paige Prostate

Human microscopic examination did not notice the atypical duct (arrow) in the HE stained specimen (a, b). On other hand, Paige Prostate pointed out this atypical duct (c, d). The results of immunohistochemical staining AMACR demonstrated that the atypical duct was latent cancer (e).

3. Gleason patternからみたPaigeとヒトの一致率

AMACRが発現を示す68領域を基にPaigeとヒトの間でGleason patternが一致した領域は64.7%(44/68領域)。不一致であった領域は35.3%(24/68領域)存在した。一致した領域のGleason patternは3,4であり,不一致であった領域については,ヒトがPattern 4の糸球体様構造とした領域をPaigeはPattern 3または一部未検出と判定(7.4%,5/68領域)(Figure 6)していた。また,ヒトがPattern 5の印環様細胞亜型とした領域をPaigeはPattern 4または一部未検出と判定(27.9%,19/68領域)していた(Figure 7, Table 3)。

Figure 6  Gleason pattern evaluation

In the case of pattern 4 including a glomerulus-like structure. Although atypical ducts are detected as adenocarcinoma (a), the area of glomerulus-like structure was classified as pattern 3 (b) or undetected (c).

Figure 7  Gleason pattern evaluation

In the case of pattern 5 including a signet-ring cell subtype. Although atypical ducts are detected as adenocarcinoma (a), the area of signet-ring cell subtype was classified as Pattern 4 (b) or undetected (c).

Table 3 Concordance rate between Paige Prostate and humans microscopic examination on Gleason pattern

Match rate between Paige Prostate and humans
based on Gleason pattern
match mismatch
64.7% (44/68 area)
pattern 3,4
35.3% (24/68 area)
pattern 4: 7.4% (5 area)
pattern 5: 27.9% (19 area)

Regarding the Gleason pattern, there were 44/68 regions that matched Paige Prostate and humans (Gleason 3, 4), and 24/68 areas that did not match (Gleason 4, 5).

4. Paigeにおける再現性の評価

3回の解析結果からみた癌領域の検出数は,1回目:143,2回目:155,3回目:160を示し,平均153 ± 7領域が検出されていた(Figure 8, Table 4)。癌領域の見落としは3回の解析結果のいずれにおいても認められなかった。

Figure 8  Number of overdetection area included in prostate biopsies

Although there is heterogeneity in the overdetection area, no cancer ducts were overlooked.

Table 4 Evaluation of reproducibility

1st 2nd 3rd Average
143 155 160 153 ± 7

Comparison of number of detections at three different occasions.

IV  考察

人工知能(artificial intelligence; AI)を用いた医療技術には,診断支援,治療計画の立案およびデータ分析など多岐にわたる。これらの技術を用いて,現在までに遺伝子情報や臨床データ分析および患者の個別化治療に対する提案までもが実用化されてきた。今日のAI医療技術は,医療効率を向上させ且つ,診断精度を高める有効な手段である。

AIの研究開発は深層学習を含めた機械学習が技術的な基盤となり,解析の特性から教師あり学習・教師なし学習・半教師あり学習・強化学習の4つに大別される。このなかで教師あり学習は回帰問題と分類問題に区別され,前者は疾病発症予測モデルや予後予測モデルに使用されている。一方,後者は医用画像解析を中心とした画像・パターン認識に高い性能を発揮する。放射線・MRI・CTスキャンおよび病理診断に至る分野において画像解析技術の開発が進み,病変の検出や分類,疾患の進行や進行の予測に活用されている1)~9)

病理診断におけるAI解析の進歩には,ホールスライドイメージ(whole slide imaging; WSI,バーチャルスライド)が確立した効果が大きい。WSIはスライドガラス標本をデジタル画像化し,モニター画面上で高精度な病理組織画像を提供する技術である。現在までにこれらの画像情報を用いることで病理診断のAI解析が可能となっている。さらに,WSIは画像解析の基盤だけでなく,病理診断のダブルチェックやコンサルテーションにも活用され,今日の病理診断の質を向上させる技術としても応用されている12)~14)。今回のわれわれの評価においてもヒトが顕微鏡下で判定したスライドガラス標本をWSIで画像化することにより,共通したHE染色標本情報を基にしてPaigeとヒトとの具体的な対比に繋がっていた。

本邦における前立腺癌の罹患率は,男性の悪性腫瘍の第1位であり,2019年に前立腺癌と診断された総数は94,748例,人口10万対で154.3例と推定される。また,2020年の前立腺癌による死亡者数は12,759人。人口10万対で21.3人の男性が死亡している15)。さらに人口の高齢化に伴い前立腺癌の罹患者は増加の一途を辿り,今後も前立腺病理診断件数の更なる増加が予想される15)。その一方で,病理診断を生業とする全国の病理専門医数(2023年10月現在)は2,787名16),人口10万人対で1.7人(2012年現在)17)と限られた人員での診療が日常化した困難をきわめる業務実態が窺える。

2021年9月,U.S. FDAは前立腺生検において潜在癌の可能性が最も高い領域を画像上特定するAI:Paige Prostate(Paige.US)を承認した10)。Paigeの有効性は,病理医16人がデジタル化した前立腺生検病理画像,計527枚(悪性171枚,良性356枚)を判定した臨床試験で検証され,病理医がPaigeによるAI診断支援システムを用いた場合と用いなかった場合の2通りの方法で各画像を判定した。その結果,AI診断支援システムを用いた場合,癌の検出率が平均7.3%向上し,前立腺潜在癌検出の一助となることが証明された11)

今回われわれのPaigeにおける試用経験より生検数(本数)からみた診断率は,感度100%,特異度82.3%を示していた。また癌領域の検出数をみた場合,ヒトが指摘し得なかった2領域を的確に指摘していた。さらに3回にわたる再現性の評価では,いずれの解析結果からも癌領域の見落としがない一方で,癌領域以外の正常領域(良性腺管,正常間質)を過剰に検出していた。また,PaigeとヒトのGleason patternの一致率をみた場合,Pattern 4の糸球体様構造およびPattern 5の印環様細胞亜型を含む領域が35.3%の頻度で不一致となっていた。このような不一致や誤認識の一端には深層学習の過程におけるアノテーション作業に原因があることが窺える。癌検出を目的とした病理組織標本のアノテーションには,癌を含む領域の画像バッチと癌を含まない領域の画像バッチのそれぞれが必要となる。この仕分け作業(物体検出,領域抽出および画像分類)に多大な労力と膨大な時間が費やされ,今日の病理診断AI開発の妨げとなっている18)~20)。これらの要因をPaigeに当てはめると,潜在癌のなかでも遭遇する頻度が低い組織亜型21),22)や非癌領域である良性腺管,正常間質の学習量が未だ不十分であることが窺え,今後のさらなる深層学習が診断率の向上に繋がるものと考られた。

Paigeにおけるわれわれの評価は,前立腺生検内における癌領域の見落としがない有用な病理診断AIシステムと考えられる。また,前立腺生検の観察者に対する負担の軽減と診断精度の更なる担保に繋がることが示された。今後,前述の如く稀な組織亜型と非癌領域に対する更なる深層学習が,より高い診断精度と正確性が保たれた病理診断AIに繋がり将来,精度管理の一環として機能することにも期待がもたれる。

本研究は日本鋼管病院倫理委員会の承認を得ています(承認番号:202301)。

COI開示

本論文に関連し,開示すべきCOI 状態にある企業等はありません。

Acknowledgement

The authors thank Dr. David Krimstra and Mr. Gerald Slootweg, Paige® and Mr. Kei Sato, Epredia, for their scientific collaboration and support to complete this study.

文献
 
© 2025 Japanese Association of Medical Technologists
feedback
Top