2025 年 74 巻 J-STAGE-1 号 p. 78-83
臨床研究において,要因と患者アウトカムに関する研究は関心が高い。患者を何日間観察した結果(入院患者であれば,それは在院日数に該当),「(軽快)退院した」もしくは「死亡した」という観察結果に関する情報は非常に重要である。ロジスティック回帰分析はアウトカムとその要因との関係を解析する代表的な解析手法であるが,観察期間が加味できない。生存時間解析には,生存時間を表した生存時間曲線(カプランマイヤー曲線)と,生存時間の比較であるログランク検定ならびに観察時間を加味した回帰分析であるCox比例ハザードモデルがよく用いられる。最低限必要なデータは,観察期間(時間・日・年 等)と2値であるアウトカムである。重症度や治療行為といった分類変数があれば生存時間曲線の比較(ログランク検定)が,さらに年齢,性別および入院時検査所見といった患者背景(共変量)があれば,生存時間の多変量回帰分析であるCox比例ハザードモデルを適用することができる。数理的な背景から理解すると難解になりがちだが,統計ソフトを用いることで簡単に解析を行うことができる。
医療現場における研究(臨床研究)において,要因・曝露とアウトカム(結果・転帰)についての研究を行うことは多い。急性心筋梗塞を例に考えてみると,事前の詳細な文献検索のもと,臨床の疑問に基づいたリサーチクエスチョンをたてる。Table 1は急性心筋梗塞を対象とした,曝露・要因とアウトカムに関するリサーチクエスチョンの例である。
曝露・要因 | アウトカム | 解釈 |
---|---|---|
喫煙の有無 | 急性心筋梗塞の発生 | 喫煙・脂質異常症・糖尿病は急性心筋梗塞の発症の原因となるか? |
脂質異常症の有無 | ||
糖尿病の有無 | ||
胸痛を起こしてから来院(治療)までの時間 | 退院時転帰(生存・死亡) or 合併症の有無 or 在院日数 or 患者ADL |
発症後早く来院することは,患者のアウトカムと関連するか? |
心血管インターベンション専門医の存在 | 一定の経験を有する医師と,そうでない医師によって,合併症の発生頻度は異なるか? | |
心電図のST形態・変化(ST上昇・ST低下) | 来院時の心電図形態が患者アウトカムと関連するか? |
これらの研究を行う際の研究の型(研究デザイン)としては「コホート研究」が最適である。コホート研究には過去起点と前向きの2つがあるが,どちらであっても,要因・曝露とアウトカムには時間差がある。ちなみに時間差がなく,同時に測定するのは「横断研究」に相当する。
ここでアウトカムが生存・死亡といった2値の研究を考える(アウトカムの発生を「イベント」と称することも多い)。観察対象は10例(生存8名,死亡2名)とする。イベント(死亡)の発生は2名なのでイベントに対するリスクは0.2(20%)であるが,観察期間が2年と2ヶ月とでは,同じ死亡2例であっても意味が異なる。短い観察期間でイベントを起こす方が,患者や臨床側にとってより切実な問題であるかもしれない。コホート研究において,何日間(または何年間,何時間)観察したという観察期間は重要な情報である。
目的変数が2値であるデータを解析する手法としてロジスティック回帰分析が知られているが,ロジスティック回帰分析は観察期間を考慮していない手法である。観察期間を用いた手法として,以下の手法が良く用いられる。
①生存時間曲線(カプランマイヤー曲線)
②ログランク検定
③Cox比例ハザードモデル
なお学術用語として「生存」という用語を用いるが,これは,イベントが必ずしも生存に関すること(生死)である必要はない。再入院の有無,再発の有無,転倒・転落事故の発生の有無など,2値であれば様々なアウトカムを用いることができる。
1. 生存時間曲線・カプランマイヤー曲線生存時間曲線とは,生存率曲線やカプランマイヤー曲線と呼ばれ,X軸には時間(この場合,「日」)を,Y軸には累積生存率(その時点でイベントを起こしていない確率)を表しており,生存時間に関する関数(生存関数)として以下のように表現できる。
F(t) = 1 − S(t)
S(t):時刻tの時点でイベントを起こしていない確率
F(t):時刻tの時点までにイベントを起こした確率
と計算できる。
Table 2は,ある疾患で入院した患者10人を観察した仮想データである。観察期間は最短10日,最長100日で,対象10人が全員死亡している。0~9日までは誰もイベントを起こしていないので,累積生存率は当然1である。しかし10日目に1名がイベントを起こしているので,累積生存率は以下のように計算される。
id | 観察期間(day) | outcome(0 = 軽快退院,1 = 死亡) |
---|---|---|
1 | 10 | 1 |
2 | 20 | 1 |
3 | 30 | 1 |
4 | 50 | 1 |
5 | 50 | 1 |
6 | 60 | 1 |
7 | 70 | 1 |
8 | 80 | 1 |
9 | 80 | 1 |
10 | 100 | 1 |
F(t) = 1 − S(t)
= 1~9日までの累積生存率
× 10~19日までの累積生存率
= 1 × {1 − (1/10)}
= 0.9
また,20日目には観察している9名に加え新たに1名にイベントが起きているので,累積生存率は10日以降の累積生存率0.9にF(t)を乗じた値となる。
F(t) = 1 − S(t)
= 1~9日までの累積生存率
× 10~19日までの累積生存率
× 20~29日までの累積生存率
= 1 × {1 − (1/10)} × {1 − (1/9)}
= 0.8
これを図として表せばFigure 1のようになる。この図は,横軸を生存時間(今回の例ではday),縦軸に累積生存割合を示したものである。観察開始から10日までは全員が生存しているので累積生存割合は1であるが,10日で1名にイベント(死亡)が発生したため,10日以降は累積生存割合に生存の割合(= 1 − イベント発生割合)を掛けると0.9になる。20日にはさらに1名イベントが発生しているため,20日以降は累積生存割合に生存の割合(= 1 − イベント発生割合)を掛けると0.8になる。このように階段状の線が描かれることになる。以降同様の計算を行えば,100日では全員がイベントを発生したことになるので,累積生存割合は0(ゼロ)となり,横軸と接するようになる。
Table 2のように対象者全員がイベントを起こした場合解釈は容易であるが,実際の場面においてはこのようになることはほとんどなく,観察期間内にイベントを起こさなかった症例や転居や転院等によってそれ以上の観察が困難という症例が含まれるのが現実である。その点を加味すればTable 3のようになる。id 2,7,10のように,観察は行えたがイベントを起こさなかった例を打ち切り(censor)という。生存時間解析は,このような打ち切りデータを考慮した解析を行うことができるのが特徴である。Table 3を図として表せばFigure 2のようになる。
id | 観察期間(day) | outcome(0 = 軽快退院,1 = 死亡) |
---|---|---|
1 | 10 | 1 |
2 | 20 | 0 |
3 | 30 | 1 |
4 | 50 | 1 |
5 | 50 | 1 |
6 | 60 | 1 |
7 | 70 | 0 |
8 | 80 | 1 |
9 | 80 | 1 |
10 | 100 | 0 |
10日で1名にイベント(死亡)が発生したため,累積生存割合が0.9となるのは同じであるが,20日に軽快退院している。即ち観察が打ち切られている。このような打ち切りについてはヒゲのような小さな縦線で表示する。30日に1名死亡しているので,累積生存時間割合0.9に,打ち切り後の生存割合(1 − 1/7)を掛けると0.77になる。以降,同様の計算を行う。id 100の最も観察期間長い症例のアウトカムは軽快退院であるためX軸とは接しない。
2. ログランク検定生存時間曲線は疾患重症度,処置行為や使用薬剤といった分類変数で層別し,比較することも多い。このような生存時間の比較には,ログランク検定(log-rank test)や一般化Wilcoxon検定が用いられる。一般的にはログランク検定が用いられることが多い。ログランク検定では,特定の時点で比較を行っているのではなく生存曲線全体を検定している。ログランク検定自体はフリー統計ソフトEZRで実施した事例を紹介する。Figure 3は3種の薬剤(A, B, C)を投与した48名による生存期間の仮想データである。薬剤Cが最も生存期間が長いことが読み取れる。図の下部にある「Number at risk」とはその時点(0日,200日,400日……)でイベントを起こす可能性がある対象者数を表している。
Figure 4は,ログランク検定の結果でありp < 0.001と有意になっている。3種の薬剤による生存期間には違いがあると解釈できる。
Cox比例ハザードモデルとは,予後因子の解析,治療効果の判定に役立つ,生存時間(観察期間)を加味した多変量解析である。ハザードとは瞬間死亡確率のことであり,罹患率比や死亡率比に相当する。Cox比例ハザードモデルでは,ハザード比が時間に関わらず一定であることが前提である。Table 4は48名に投与した3種の薬剤(A, B, C),年齢,観察期間およびアウトカムである。このデータを用いてCox比例ハザードモデルを行った結果がFigure 5である。時間変数にはday,イベントはoutcome(0 = 打ち切り),説明変数として年齢と薬剤を投入した。その結果,年齢(ハザード比1.11),薬剤B(ハザード比0.18),薬剤C(ハザード比0.05)でありいずれも有意であった。比例ハザード性はどちらもp > 0.05となっており,比例ハザード性の仮定は保たれていると考えられる。具体的な解釈としては,年齢が1歳上がれば死亡に対するハザード比は1.11倍(加齢は死亡のリスク),薬剤Aを基準とした場合,薬剤Bであればハザード比は0.18倍,薬剤Cであれば0.05倍(薬剤BやCを用いることは,薬剤Aよりも生存期間が長い)になると解釈することができる。
id | day | outcome (0 = 軽快退院,1 = 死亡) |
drug (A, B, C) |
age |
---|---|---|---|---|
1 | 40 | 1 | A | 61 |
2 | 36 | 1 | A | 65 |
: | : | : | : | : |
48 | 1171 | 0 | C | 52 |
本論文に関連し,開示すべきCOI 状態にある企業等はありません。