2013 Volume 30 Issue 1 Pages 18-22
一般的に予後の良い甲状腺乳頭癌に対しては可及的に甲状腺を温存する手術を行って甲状腺機能を維持し,骨密度低下の懸念もあるTSH抑制療法は積極的には行わないという治療方針は,日本では主流であったが,欧米のガイドラインとは相反する。われわれの方針の妥当性を立証するためにTSH抑制療法の乳頭癌に対する再発抑制効果についてのランダム化比較試験を行った。患者登録開始から13年を要したが,無再発生存率においてTSH抑制療法非施行群の成績は,施行群に比較して10%以上劣っていないことが証明され,5%以上劣っていないことが示された。また,ランダム化試験に並行してTSH抑制の骨密度に及ぼす影響についての前向き比較試験を施行した。その結果,とくに閉経後女性ではTSH抑制による骨密度低下が顕著となる傾向があることが示された。これらの研究を通じて気づいた,高位のエビデンスを得るための研究を日本から世界に発信するうえで必要なことについて述べる。
甲状腺乳頭癌(PTC)治療においては,甲状腺切除手術,術後放射性ヨード(RAI)によるアブレーション,および甲状腺ホルモン製剤(LT4)投与による内因性甲状腺刺激ホルモン(TSH)抑制療法(TST)が中核をなす。後2者は甲状腺全摘手術を前提としており,現代外科学が術後の生活の質(QOL)を重視して治療縮小の可能性を模索する傾向にあるにもかかわらず,欧米のガイドライン[1]は今なおPTCに対して(RAI治療の適応縮小やリンパ節郭清の省略は考慮するものの),甲状腺全摘推奨の原則は譲ろうとしていない。一方,わが国においては従来から,とくに低危険度とみなされるPTCに対しては腺葉切除や亜全摘など甲状腺を温存する手術が採用されることが多かった。この独特な方針採用の理由として,日本におけるRAI治療へのアクセスの悪さが挙げられることも多いが,疾患特異的10年生存率が99%を超える通常のPTCの生物学的性質を正しく理解すれば,副甲状腺機能低下や反回神経麻痺のリスクが低いばかりか,甲状腺機能も維持される可能性が高い甲状腺温存切除の妥当性は(東日本大震災によるLT4の一時供給停止などを引き合いに出すまでもなく),評価されてしかるべきものであろう[2]。
実際のところ,甲状腺切除範囲やRAI治療の有無による治療成績の検討において,ランダム化比較試験(RCT)はこれまで行われたことはなく,高位のエビデンスは乏しい。TSTの再発予防効果についても,1970年代のMazzaferriらによる有名な報告[3](PTC術後の5年累積再発率が補助療法なしでは約20%であったのに対し,甲状腺ホルモン剤投与により約10%に低減した)は後向きの多施設症例集積研究によるものであるし,近年のMcGriffらによるメタアナリシス[4]においても,TSTは甲状腺分化癌の再発,病勢進行および原病死のリスクを減少させるとの結果が示されているものの,前向き研究やRCTは全く行われておらず,TSTの効果は“probable”に過ぎないとされている。
「PTCの術後にTSTを施行しなくても,同等の治療成績が得られる」という仮説を証明する非劣性試験を行うことは,甲状腺全摘・補助療法施行という方針が常態化した欧米では困難であるうえ,甲状腺温存切除・補助療法なしというわが国独自の治療方針の正当性を支持するうえで重要であると考え,単一施設での非盲検RCTを行った[5]。
TSTの重要な副作用のひとつとして,骨密度(BMD)減少が挙げられる。最近のメタアナリシス[6]によると,男性や閉経前女性では影響がないが,閉経後女性ではTSTにより骨粗鬆症のリスクが上昇するとされた。しかしながら,大多数の研究は横断研究であり,前向き研究はほとんど行われていない。今回のRCTに並行して,TSTの女性BMDに及ぼす影響について前向き比較試験を行った[7]。
PTC術後患者における,TST非施行群の施行群に対する非劣性を,臨床的再発をエンドポイントとするRCTにより検証した。
PTC患者をAMES癌死危険度分類による層別化のうえ,TST施行(A)群,非施行(B)群に無作為に割付けた。TSH値(mIU/L)はA群で<0.01,B群で正常範囲(0.4~5.0)に調整した。
対象は当院初取扱いPTC症例で,術前穿刺吸引細胞診にてPTCと診断され,術後病理組織学的にそれが確認された患者とし,腫瘍最大径1cm以下の微小癌症例,年齢80歳以上の症例,遠隔転移を認めた症例,バセドウ病・心疾患・重症骨粗鬆症合併例および術後病理組織診断でPTC以外の診断を得た症例は除外した。また,A群で甲状腺中毒症状,狭心症や不整脈,骨粗鬆症の進行を認めた症例は,TSTを中止した。
A群の5年無再発生存率(DFS)を90%と仮定し,非劣性マージンを10%に設定すると各群204例で検出力は80%となる。10%非劣性の基準となるハザード比(HR)は2.12なのでノンパラメトリック検定によりB群のA群に対するHRの95%信頼区間(95%CI)の上限が2.12より小さければ非劣性が証明されたと判断できる。
1996年に患者の割付けを開始,2005年までにA群218例,B群215例に到達した。2009年までに観察期間は3~12年,平均7年に達した(図1)。両群間で年齢,性別,甲状腺切除術式,AMES癌死危険度分類,リンパ節転移に差はなかった。A群のTSHは平均0.07±0.13とよく抑制されており,B群の平均3.19±1.74との間に有意差を認めた(p<0.0001)。A群の再発は22例(10%:リンパ節21,遠隔9),B群では27例(13%:残存甲状腺1,リンパ節25,遠隔12)で,intent-to-treat解析による5年DFSはA群91%,B群89%で有意差はなかった(p=0.41)。HRは1.04,95%CIは0.85~1.27で,10%非劣性基準である2.12を下回ったうえ,5%非劣性基準の1.54より低かった(図2)。
TSH抑制療法(TST)の甲状腺乳頭癌(PTC)再発抑制効果についてのランダム 化比較試験のフローダイアグラム
ランダム化比較試験の結果:全症例についての無再発生存曲線
以上,PTCに対するTSTの効果について世界初のRCTを施行した結果,TST非施行群がTST施行群に対して再発率で10%以上劣っていないことが証明され,さらに5%以上劣っていないことが示された。
上記RCTに並行して,TSTのBMDへの影響を前向きに比較検討する試験を行った。
各群の女性患者につき,1年ごとに腰椎(L2-4)BMDを二重エネルギーX線吸収測定法により計測した。20歳未満の患者,術後副甲状腺機能低下,原発性副甲状腺機能亢進症合併例および骨粗鬆症の薬物治療・乳癌ホルモン療法・ステロイド治療中の者は除外した。また経過中にこれらの薬物治療を開始した者,バセドウ病・骨折・骨転移発生例,妊娠例およびA群でのTST中止例はその時点で脱落とした。
前向き試験のフローダイアグラムを図3に示す。A群144例,B群127例の適格症例において,年齢,body mass index,甲状腺切除術式および術前BMDの群間差はなかった。
甲状腺乳頭癌術後TSH抑制療法(TST)の骨密度への影響についての前向き比較試験のフローダイアグラム
B群でPTC手術時に比較して有意なBMD減少を認めたのは術後5年目であったのに対し,A群では術後1年目からすでに有意なBMD減少を認めた。術後1年目でTスコアが0.6以上低下したのは,B群では5%の症例のみであったがA群では17%と有意に多かった。A群で1年目に有意なBMD減少を認めたのは50歳以上の患者で,50歳未満では認めなかった。また,5年間のTST施行後,Tスコアが-2.0以下となった患者は20例,ならなかった患者が100例であったが,前者は後者に比較して有意に高齢で術前BMDが低かった。
以上より,年齢50歳以上の患者(閉経後患者),もともとBMDが低めの患者では,TSTによるBMD低下が顕著となる傾向があることが示された。
上記RCTの報告を米国内分泌学会(The Endocrine Society)の機関誌に投稿した際,査読者との間で様々なやり取りがあった。再発の評価を主に頸部超音波検査で行い,RAIシンチグラフィや血清サイログロブリン値測定が含まれていないことが問題とされ,彼我の医療環境に配慮した考察が必要とされた。また,米国では医師・患者双方とも甲状腺全摘以外の手術方針は受容しがたい感覚があることをうかがい知ることができた。甲状腺を全摘しても患者はLT4服用により通常の生活を送れるので問題ないとの見解で,生涯にわたり薬物が必須となることへの抵抗感は全くない印象であった。それでもMayo Clinic のHay教授からは,「このような忍耐を要する,良いワインの熟成を待つような研究は米国では行いえないだろう」との賞賛の言葉をいただいた[7]。
そのほか,国内からも統計学的なパワー不足を懸念するご意見をいただいた。確かに非劣性マージンとして10%の設定は大きすぎる印象であるが,これを5%にすると必要なサンプルサイズは690例と3倍以上に跳ね上がる。また,エンドポイントを疾患特異的生存とすると,必要症例数は3,000例以上,観察期間は20年以上となり,1施設では到底実現できない研究デザインとなってしまう。
有意差はないものの再発はTST非施行群の方に多いことを重視すべきではないか,とのご指摘もいただいた。今後,さらに観察期間を増やして検討したいところであるが,確かに本研究で立証されたのはTST非施行例の施行例に対する非劣性であって,TSTの効果を全否定するものではない。とはいえ,「術後にいずれにせよTSTを施行するのが良いのだから,甲状腺全摘を行うべき」という論理には反論を企てうる結果であると考えている。
2010年発行の『甲状腺腫瘍診療ガイドライン』[8]では,甲状腺分化癌術後のTSTについて,再発リスクが低い患者では,TSTの意義は明らかでなく,副作用の観点から血中TSHは正常下限に維持するのが良いとする一方,癌の残存が疑われる高リスク患者では,TSTにより予後が向上するので,特別な禁忌がなければ血清TSHは0.1より低く維持すべきであるという推奨文が掲載されている。当科においては以上2つの研究結果をふまえ,2012年より,癌による再発・死亡リスクとTSTの副作用リスクを考慮したTST施行方針(表1)を採用している。
当科における甲状腺乳頭癌に対する新しいTSH抑制方針
RCTの研究デザインを適切に構築するためにはConsolidated Standards of Reporting Trials(CONSORT)statement(www.consort-statement.org)のチェックリストが有用である。サンプルサイズの設定から無作為割付けの方法,フローダイアグラムの描き方,intent-to-treat解析の方法,プロトコール逸脱などバイアスや精度低下の原因となりうる事象についての検討まで,手順ごとに詳細に解説されており,これに従うことで正しい手法による正確な報告が可能となる。とはいえ,一般臨床家にとって医用統計学は馴染みの少ない分野であり,その道の専門家の助力があると心強い。さらに施設ごとの倫理審査とインフォームドコンセントの手続きをふまえることは言うまでもないが,現在においてはしかるべき公的組織(大学病院医療情報ネットワーク研究センター:UMINなど)に臨床研究登録を行うことも求められている。
高位のエビデンスがいまだ十分でない甲状腺癌の外科学の世界において,これまで独自の方針をとってきた日本からの様々なデータ発信は貴重である。彼我の医療環境に配慮した考察さえ行えば,欧米から評価されるうえでかえって有利かもしれない。ネックとなる症例数の集積においては,多施設共同研究の推進が解決の糸口となるかもしれない[9]。本RCTも患者登録開始から予定のサンプルサイズ達成までに9年,平均観察期間7年に到達するまでに13年を要した。十分な観察期間を得るためには,世代を超えた確実な研究業務の引き継ぎとともに,「一刻も早く始めること」が大切であろう。