Official Journal of the Japan Association of Endocrine Surgeons and the Japanese Society of Thyroid Surgery
Online ISSN : 2758-8777
Print ISSN : 2186-9545
Statistical analysis of patient-reported outcome in clinical studies.
Shiro Hinotsu
Author information
JOURNAL FREE ACCESS FULL-TEXT HTML

2019 Volume 36 Issue 4 Pages 198-201

Details
抄録

FDAでは臨床研究のアウトカム評価(Clinical Outcome Assessment)を以下の様に定義している。「A COA is any assessment that may be influenced by human choices, judgment, or motivation and may support either direct or indirect evidence of treatment benefit.」である。また,COAは4つの要素から構成されており,それらの要素は,Patient-reported outcome (PRO),Clinician-reported outcome (CliRO),Observer-reported outcome (ObsRO)とPerformance outcome (PrefO)である。

PROの一つとしてHealth-related quality of life (HROLあるいはHRQOL)がある。近年,医療経済的視点での癌診療評価にQuality-adjusted Life Year (QALY)という概念が導入され,QALYの計算にはEQ-5DなどのQOL調査票を用いて得られたQOLの評価が必須である。

しかしながら,QOL評価に対して,生存/死亡のようなハードエンドポイントではないことから,「不確実な測定値」というイメージを持っている臨床医も少なからず存在する。

そこで,臨床医のPROやQOLに対する理解を助けることを目的としてQOL調査票作成プロセスについて概説した。今後PROを取り入れた臨床研究計画の際に役立つことを期待している。

はじめに

米国Food and Drug Administration(FDA)のホームページのDrug Development Tools[]に臨床アウトカム評価(Clinical Outcome Assessment:COA)について掲載している。COAの定義はFDAのアーカイブ[]に掲載されており,“A COA is any assessment that may be influenced by human choices, judgment, or motivation and may support either direct or indirect evidence of treatment benefit. Unlike biomarkers that rely completely on an automated process or algorithm, COAs depend on the implementation, interpretation, and reporting from a patient, a clinician, or an observer. The four types of COAs are patient-reported outcome (PRO) measures, clinician-reported outcome (ClinRO) measures, observer-reported outcome (ObsRO) measures, and performance outcome (PerfO) measures.”と定義されている。このCOA定義の中に,COAは4つの要素から構成されており,それらの要素は,Patient-reported outcome (PRO),Clinician-reported outcome (CliRO),Observer-reported outcome (ObsRO)とPerformance outcome (PrefO)である。これらの解説はJ-SUPPORTのホームページ[]に日本語で記載がある。COAと4つの要素,それらの例を図1に示す。図のなかにあるPRO-CTCAEについては,JCOGのホームページ[]に日本語訳がある。この図で確認しておきたいことは,PROとQuality of Life (QOL)は同じものを指しているのではなく,PROの方が広い概念で,PROの一つとしてQOLがあるということである。

図1.

Clinical Outcome Assessmentの要素

COA: Clinical Outcome Assessment

PerfO: Performance outcome

ObsRO: Observer-reported outcome

ClinRO: Clinician-reported outcome

PRO: Patient-reported outcome

CTCAE: Common Terminology Criteria for Adverse Events

PS: Performance Status

QOL: Quality of life

PRO-CTCAE: Patient-reported Outcome version of the Common Terminology Criteria for Adverse Events

なぜPROの評価が必要か

FDAの定義におけるClinRO(医療者が評価したアウトカム)のみではなく,なぜPROが必要なのであろうか。たとえば患者の状態を評価の一つとしての有害事象を,医療従事者は過小評価しているという報告[]がある。この研究では1995年から2000年に診断された前立腺癌治療において,「倦怠感」を医療従事者は患者の19%に認めたと記載しているのに対し,患者アンケートでは74%に認めていた。「腹痛/疼痛」においても医療従事者は8%に認めたと回答し,患者は49%に認めたと回答している。その他の項目(「尿失禁」,「下痢」,「便意切迫感」,「リビドーの低下」および「勃起障害」)のいずれにおいても,医療従事者の回答は患者の回答よりも低い割合であった。さらに,この傾向は2001年から2007年に診断された患者集団においても同様であった。このような傾向は他の疾患領域における研究において,経時的に副作用を評価したところ,どの時点でも医師の評価は患者による評価の値よりも低い発生率であった[]。これらのことから,多くの臨床医は,患者の主観的な有害事象を過小評価していることがわかる。ほとんどの臨床医は自分の評価(ClinRO)とPROとの乖離はすでに十分認識していると思われる。

がん臨床試験におけるPRO/QOL

悪性腫瘍を対象とした臨床試験でPROあるいはQOLが注目され始めたのは,1995年にFDAが膵癌に対するGemcitabineの承認時に“Clinical Benefit Response”という概念を導入し,QOLの量的評価を取り入れて承認したことからといわれている[]。生存率の大幅な改善が難しい領域では,ハードエンドポイントとしての生存率などの有効性に関して既存治療と同等で,症状やQOLを改善する新薬の承認時にPROが取り入れられるようになってきた。悪性腫瘍の臨床試験の場合,プライマリーエンドポイントはハードエンドポイントで,セカンダリーエンドポイントとしてPROが取り入れられることが多い。腎癌の領域で,PROをプライマリーエンドポイントにしたランダム化比較試験[]が報告されているが,悪性腫瘍の領域においては,このような臨床研究は少ない。また,PROとしてのQOLを評価する場合には,国際的に評価され,日本語化の信頼性,妥当性が検証されたQOL調査票を使うことが必須である。例えば近年,医療経済的視点での癌診療評価にQuality-adjusted Life Year (QALY)という概念が導入され,QALYの計算にはEQ-5D[]などの信頼性と妥当性が検証済みのQOL調査票を用いて得られたQOLの評価が必須である。

QOLの評価

QOLの概念はWHOの「健康の定義」[10]から広く知られるようになったが,QOL評価に対して,生存/死亡のようなハードエンドポイントではないことから,根拠なく「なんとなく胡散臭い」イメージを持っている臨床医も少なからず存在する。「そもそも,生活の“質”(Quality of Life)を量的評価であるスコアにする事に無理がある」といった意見を耳にしたこともある。しかし,例えば受験生の「学力」という「質」を「入学試験の点数」という量的指標で評価することが広く受け入れられているように,妥当な評価ツールを用いれば評価は可能であると考える。入学試験においても,完璧な評価ではないことは承知の上で使用しているわけで,少なくとも「信頼性と妥当性が評価された標準的QOL調査票を用いたQOLスコアの値」をClinical Outcome Assessmentの指標とすることは全否定するべきものではない。むしろ,「QOLスコアの値」の意味と限界を知った上で上手に使うことが肝要である。

また,近年QOL評価にも様々な工夫されている。たとえば,検査値の検定を行った際の「統計学的有意」と「臨床的有意」をしっかり考察する事がされているように,QOLスコアのminimally important difference (MID)やclinically important difference (CID)という概念が取り入れられている[11]。対象とする疾患とQOL調査票の組み合わせで「臨床的に有意なQOLスコアの変化」を評価するという考えである。

QOL調査票が作成される際には,測定される尺度の反応性(QOL変化に応じてスコアが変化するか)や,選択肢が少なすぎることによる底打ちや天井うちの状態にならないように工夫がされている。例えばEQ-5DというQOL調査票では,以前は各質問に対して3択であったが,5択のEQ-5D-5Lが開発された。

海外で開発されたQOL調査票を日本語化する際には,版権などの権利に関する問題をクリアした上で,過去に日本語化作業を行った経験のある研究者の協力を得ることと,ある程度以上の資金を確保することが重要である。基本的な概念を教科書[12]で確認して,調査票日本語化に関する論文[13]などを参考に日本語化作業を計画することが大切である。既に,SF-36やEORTC-QLQC30のように広く用いられている調査票による評価を研究計画に入れる事もあるし,新しい領域で日本語化された調査票が存在しない場合は日本語化そのものをプロジェクトとして計画することも考慮するべきであろう。

PROの解析

PROの評価が,外来で化学療法を行っていた癌患者の予後を改善していたという論文がある[14]が,この論文では症状の変化をタブレットを用いて早く知ることにより救急外来を受診する頻度を減らし,予後を改善していたという結果である。この論文の解釈としては,QOLを改善する事により予後を改善したのではなく,PROとしての症状報告システムが,より早く症状の変化を感知することができ,それによりQOLも改善し,予後も改善したと考えるべきである。つまり,ツールを使うという介入による結果としてのQOLと予後が改善したということである。

比較試験のセカンダリーエンドポイントとしてPROを用いている研究の例を示す。少し古い論文ではあるが,2013年のNEJMに掲載された腎癌を対象としたPazopanibとSunitinibの比較試験である[15]。この臨床試験では,PazopanibのSunitinibに対する非劣性試験で,主要評価項目はProgression-free survivalである。非劣性マージンはハザード比で1.25としていたところで結果はハザード比1.05であったため非劣性を証明した。セカンダリーエンドポイントの1つとしてQOLをFACIT-Fで評価していた。投与開始からどちらの薬剤を投与された群もQOLの低下を認めたが,Pazopanibの低下(約3.0)がSunitinibの低下(約6.0)よりも少なかった。癌化学療法による貧血のFACT-FでのMIDが3.5である[11]ことから,ある程度意味のある差であると考えて良い。このようにMIDを考慮する事で,QOL評価の妥当性を確認する事が可能である。

観察研究におけるQOLの例として,日本で行われた限局性前立腺癌患者の前立腺全摘(手術)を選択した症例と,内分泌療法を選択した症例のQOLをSF-8[16]などを用いて記述疫学的に報告した論文[17]を紹介する。この論文では,群間比較の検定は行わず,治療前と治療後3カ月および治療後12カ月の3点の変化をSF-8とEPIC[18]で図示している。

PROやQOLを調査した際の解析で重要な事は,いかに欠損値のないデータ収集をするかである。たとえば,前述の前立腺癌患者の観察研究では,SF-8の回収率は治療前95.1%,3カ月後88.8%,12カ月後76.4%である。同様にEPICはそれぞれ94.7%,88.7%,74.9%であった。高い回収率であることで,結果のバイアスを減らす事ができる。教科書的には,欠損のメカニズムにはMissing Completely At Random, Missing At RandomおよびMissing Not At Randomがあり,順にバイアスが少ない。欠損データに対する対応としては,完全測定例のみを用いた解析,全測定データを用いた解析,データ補完を行った解析がある。データ補完を行った解析は,基本的に「感度分析」として行われるが,補完方法としてLast observation carried forward, 最悪値の補完,平均値の補完,回帰分析によって補完および背景の似た対象者のデータで補完などがある。たとえば,単に患者が回答や返送を忘れて複数時点の中間時点が欠損になっており,その直前のデータが比較的短期間に取られている場合はLast observation carried forwardを用いることが妥当と考えられる。また,患者の状態が悪化してQOLデータを取得する事ができなかった場合は最悪値の補完が妥当であろう。いずれにしても,補完したデータは感度分析としての解析であり,主たる解析は存在するデータを用いたものになるので,できるだけ欠損値の無いデータを集めることが重要であることを改めて強調しておく。

おわりに

今回,臨床医のPROやQOLに対する理解を助けることを目的としてCOAとPRO/QOLの関連とPROの解析について概説した。今後の臨床試験において,PROの評価は重要視されると思われる。この解説によりPRO/QOLに対する理解が進み,臨床研究実施の際に役立つことを期待している。

【文 献】
 

この記事はクリエイティブ・コモンズ [表示 - 非営利 4.0 国際]ライセンスの下に提供されています。
https://creativecommons.org/licenses/by-nc/4.0/deed.ja
feedback
Top