2014 Volume 47 Issue 7 Pages 365-373
目的:上部消化管術後のQOLを測定する尺度としてGastrointestinal Symptom Rating Scale(以下,GSRSと略記)がしばしば用いられている.今回,術後患者の評価尺度としてのGSRSの妥当性を検証した.対象と方法:2012年6月から12月の期間,胃・食道術後患者を対象に横断的調査を行い,GSRSの各下位尺度得点(酸逆流,腹痛,消化不良,下痢,便秘)を評価した.併存的妥当性としてSF-12,known-groups妥当性として,術式,栄養学的指標,および上部消化管内視鏡検査との関連を評価した.結果:対象は325例,年齢中央値66歳,施行術式は食道切除109,胃全摘89,胃切除124,胃部分切除5例であった(重複あり).GSRSの得点は全項目で分布が偏っており,強い床効果を認めた.SF-12のサマリースコアとGSRSの相関係数は,腹痛と精神的側面のQOLスコアにおいて0.314であったが,その他の組み合わせは0.3以下であり,相関関係が強いとはいえなかった.BMI 18未満の群では腹痛のスコアが有意に高値であったが,その他の指標(術式,血清アルブミン値,内視鏡所見)のいずれにおいても有意な関連は認めなかった.まとめ:GSRSは上部消化管術後患者に対するQOL尺度としては計量心理学的妥当性が低く,臨床研究のアウトカムとしては不適切である.
胃・食道の手術後にはさまざまな消化器症状や体重減少,栄養障害などが出現し,患者QOLに大きく影響する1).これまで術後の後遺症状や栄養状態およびQOLを改善する目的でさまざまな再建術式や術後の介入が考案され,多くの臨床研究が報告されてきたが,このような臨床研究の問題点の一つにアウトカム測定の妥当性が挙げられる2).すなわち,上部消化管の術後障害やQOLを測定する尺度の妥当性を検証した研究が少ないという問題点がある.既存研究では,上部消化管術後の後遺症状やQOLを評価する尺度として,Gastrointestinal Symptom Rating Scale(以下,GSRSと略記)3)4)やEuropean Organization for Research and Treatment of Cancer Quality of Life Questionnaire Core 30(EORTC QLQ-C30)の臓器別モジュールであるOES185),STO226),Dysfunction After Upper Gastrointestinal Surgery(DAUGS32)7)などが用いられているが,いまだゴールデンスタンダードとして確立したものはない.その中で,15の質問項目からなるGSRSは日本語の翻訳版が普及しており,胃癌や食道癌などの手術後患者のQOL評価にも利用されている8)~10).しかし,本来GSRSは過敏性腸症候群と消化性潰瘍の患者を対象として開発され3),その後質問紙の改良とともに逆流性食道炎についても計量心理学的妥当性が証明されてはいるが11)12),胃癌や食道癌の術後患者に対する妥当性は検証されていない.GSRSの測定する概念は酸逆流・腹痛・消化不良・下痢・便秘の五つであるが,上部消化管の外科手術後には,ダンピング症状・小胃症状・腸液の逆流など過敏性腸症候群や逆流性食道炎などの患者とは病態生理学的にも症候論的にも全く構成概念が異なるであろう障害がいくつも出現する.本研究の目的はGSRSが,このような上部消化管術後患者のQOLを測定する尺度として利用可能かどうか,計量心理学的観点から検証することである.今後,患者報告型のアウトカムの重要性が高まる中,消化器外科領域においても既存尺度の妥当性を見直すことは重要である.
研究デザインは多施設共同の横断型観察研究である.がん研究会有明病院,都立駒込病院,天理よろづ相談所病院,亀田総合病院の4施設で行った上部消化管症状の尺度開発研究において調査・回収された患者データを利用した.本研究は全施設で倫理委員会の承認を得て行った.
1. 対象2012年6月から12月の期間,下記の適格基準を満たす症例に対して調査を行った.
①食道または胃の疾患に対する手術をうけ,何らかの消化器愁訴を有する外来通院患者.
②術後経過時間が6か月以降,5年未満の患者.
③活動性の重複癌がない.
④悪性腫瘍の再発がない.
⑤20歳以上で文書の同意が得られた患者.
補助化学療法または放射線治療後6か月以内,他の消化器手術の既往がある,向精神病薬内服中,妊娠中の患者は除外した.
2. 方法対象者には外来受診時に文章による説明と同意取得を行った.連結可能なコードを各症例に割り振り,質問紙に回答を依頼した.個人の回答内容は主治医に見られることなく郵送で研究事務局が回収することを患者に説明し,研究事務局は主治医より別個に回収した下記の調査項目との連結を行いデータセットを作成した.
使用したGSRS質問紙を簡略化してFig. 1に示した.また,併存的妥当性検証を行うために,日本人における妥当性が十分に検証されている包括的QOL尺度として,SF-12質問紙13)を用いた.
The GSRS questionnaire has 15 items and a 7-point graded Likert-type scale. This simplified figure was quoted from reference 3.
その他の臨床的な調査項目として,年齢,性別,原疾患,術式,既往症,術後経過期間,手術前および調査時の身長・体重を医師より取得した.また,質問紙の回答と同時期の利用可能な血液検査成績(リンパ球数,ヘモグロビン値,血清アルブミン値,血清コレステロール値),および上部消化管内視鏡検査の結果を調査,回収し解析に利用した.
3. 解析①GSRSの各項目と五つの下位尺度スコア(酸逆流,腹痛,消化不良,下痢,便秘)の記述統計量を評価した.
②GSRSの基準関連妥当性として,術式・内視鏡所見・栄養指標についてknown groups妥当性(臨床上明らかにQOLに差異がある既知の群間において得点を比較し,尺度の妥当性を検証する手法)の検証を行った.すなわち,胃全摘後の患者は幽門側胃切除後の患者と比較して逆流および下痢症状の程度が明らかに強いことが臨床的見地から予測されるため,この2種類の術式間における酸逆流,下痢のスコアおよび術後経過時間を比較した.また,内視鏡所見では逆流性食道炎,残胃炎,胃内残渣の有無を評価し,それぞれ酸逆流,腹痛,消化不良の項目との関連を,栄養指標においてはBMI=18 kg/m2,血清アルブミン値4.0 g/dlをカットオフとし,下位尺度スコアを比較した.各スコアの平均値をt検定によって比較し,有意差が認められ,その結果が臨床的に妥当と考えられる場合,known groups妥当性ありと判定した.
③併存的妥当性としてSF-12の3コンポーネント・サマリースコア,すなわち身体的側面のQOL得点(physical component summary;以下,PCSと略記),精神的側面のQOL得点(mental component summary;以下,MCSと略記),役割/社会的側面のQOL得点(role/social component summary;以下,RCSと略記)の値と,GSRSの下位尺度スコアの相関係数を算出した.ピアソンの積率相関係数0.4以上,かつ有意確率5%未満を相関ありとし,SF-12との相関が得られたGSRS下位尺度は妥当性ありと判断した.
なお,本研究は探索的検討であることから検定の多重性に関しては考慮しないこととした.欠測値は2.31%と少なく,補完はしないこととした.
360人に回答を依頼し,325人(90.3%)の回答を得た.Table 1に患者背景を示した.年齢中央値66歳(32~85),男性213,女性112,原疾患は食道癌104,胃癌216,胃GIST 10,その他の疾患5であった(食道癌・胃癌の重複が8例,食道癌・胃GISTの重複が2例あり).調査時期は,平均術後19.8か月(±10.2,6~60)であり,施行された術式は食道切除109,胃全摘89,幽門側胃切除術96,噴門側胃切除術10,幽門保存胃切除術18,胃部分切除5であった(食道切除と胃部分切除の重複2例あり).なお,168名(51.7%)に腹腔鏡下または胸腔鏡下手術が施行されていた.対象患者の有する主な消化器愁訴の内容は,逆流症状205例(63.1%),下痢症状239例(73.5%),腹部膨満症状253例(77.8%),小胃または無胃症状と思われる上腹部不快感197例(60.6%),ダンピングと思われる症状126例(38.7%)であった.
Number | Proportion (%) | |
---|---|---|
All Patients | 360 | 100 |
Respondents | 325 | 90.3 |
Median Age (range) | 66 (32–85) | |
Sex | ||
Male | 213 | 65.5 |
Female | 112 | 34.5 |
Disease* | ||
Esophageal cancer | 104 | 32.0 |
Gastric cancer | 216 | 66.5 |
Gastric GIST | 10 | 3.1 |
Others | 5 | 1.5 |
Procedure** | ||
Esophagectomy | 109 | 33.5 |
TG | 89 | 27.4 |
DG | 96 | 29.5 |
PPG | 18 | 5.5 |
PG | 10 | 3.1 |
LR | 5 | 1.5 |
Laparoscopic Surgery | 168 | 51.7 |
Symptom | ||
Reflux | 205 | 63.1 |
Diarrhea | 239 | 73.5 |
Distention | 253 | 77.8 |
Epigastric discomfort | 197 | 60.6 |
Dumping | 126 | 38.7 |
GIST; gastrointestinal stromal tumor, TG; total gastrectomy, DG; distal gastrectomy, PPG; pyrorus preserving gastoretomy, PG; proxmal gastrectomy, LR; local resection. * Diseases were included 10 overlapping cases. ** Procedures were included 2 overlapping cases.
各項目の度数分布はFig. 2のとおりであった.項目1,4,7で無回答が多かった.また,全ての項目において平均値は3未満であり,特に項目1,4,5,8は得点が低かった.各項目の標準偏差は0.79~1.70であった.GSRSの下位尺度は,酸逆流,腹痛,消化不良,下痢,便秘の5因子構造からなっておりTable 2に各スコアの結果を示した.全体として得点の平均値は低く,特に腹痛,消化不良については高い得点の回答者が少なかった.
The distribution of all items in GSRS show the floor effect. The transverse axis is the grade of answer and the longitudinal axis is the number of patients. “m”=missing data.
Subscale | N | Average | SD | Range |
---|---|---|---|---|
Regurgitation | 308 | 1.97 | 1.19 | 1–7 |
Pain | 305 | 1.51 | 0.80 | 1–6.33 |
Dyspepsia | 301 | 1.96 | 0.89 | 1–5.25 |
Diarrhea | 316 | 2.48 | 1.45 | 1–7 |
Constipation | 314 | 2.27 | 1.22 | 1–7 |
N; the number of valid response, SD; standard deviation
胃全摘後と幽門側胃切除後の酸逆流スコアはそれぞれ1.97(±1.31),1.66(±0.991),下痢スコアはそれぞれ2.52(±1.41),2.62(±1.57)で,いずれもt検定にて有意差を認めなかった(Fig. 3).また,術後経過時間は胃全摘後,幽門側胃切除後でそれぞれ平均19.2,19.9か月(P=0.521)であり明らかな差を認めなかった.
Comparison of subscale scores between esophagectomy, total or distal gastrectomy. One-way ANOVA showed a significant difference in regurgitation.
QOLと関連が期待される内視鏡所見の項目として逆流性食道炎の有無と酸逆流スコア,残胃炎の有無と腹痛スコア,胃内残渣の有無と消化不良スコアの関連について,それぞれt検定にて評価した(Table 3).いずれも内視鏡所見が陽性の場合はそれぞれの下位尺度スコアは0.08~0.2程度の軽度上昇を認めたが,有意差は認めなかった.
GERD | + | – | P value |
Regurgitation | 2.143 | 2.015 | 0.458 |
Remnant Gastritis | + | – | P value |
Pain | 1.567 | 1.480 | 0.398 |
Saburra | + | – | P value |
Dyspepsia | 2.1150 | 1.9125 | 0.2720 |
GERD; gastro-esophageal reflux disease
栄養状態としてBMIと血清アルブミン値とGSRS下位尺度スコアの関連について,それぞれt検定にて評価した(Table 4).BMI 18未満の症例では腹痛のスコアで有意に高値を認めた.その他の下位尺度では差を認めなかった.血清アルブミン値の低下している症例において下位尺度スコアはいずれも有意差がなく関連を認めなかった.ただし,いずれの下位尺度スコアも低栄養群で軽度上昇する傾向があった.
Subscale/BMI | <18 | ≥18 | P value |
Regurgitation | 2.030 | 1.953 | 0.616 |
Pain | 1.667 | 1.458 | 0.042 |
Dyspepsia | 2.022 | 1.939 | 0.474 |
Diarrhea | 2.671 | 2.409 | 0.155 |
Constipation | 2.325 | 2.252 | 0.638 |
Subscale/Alb | <3.9 | ≥4.0 | P value |
Regurgitation | 2.018 | 1.907 | 0.521 |
Pain | 1.527 | 1.486 | 0.721 |
Dyspepsia | 1.892 | 1.981 | 0.510 |
Diarrhea | 2.579 | 2.466 | 0.598 |
Constipation | 2.333 | 2.248 | 0.637 |
BMI; body mass index (kg/m2), Alb; serum albumin level
SF-12の3コンポーネント・サマリースコアとGSRSの下位尺度得点の相関係数をTable 5に示した.腹痛とMCS,便秘とPCSの相関係数がそれぞれ0.314,0.303,それ以外の相関はいずれも0.3未満であり,直線的な相関関係が強いとはいえなかった.
Subscale | PCS | MCS | RCS |
---|---|---|---|
Regurgitation | 0.169 | 0.247 | 0.190 |
Pain | 0.190 | 0.314 | 0.162 |
Dyspepsia | –0.0008 | 0.235 | 0.163 |
Diarrhea | –0.075 | 0.277 | 0.136 |
Constipation | 0.303 | 0.081 | 0.171 |
PCS; physical component summary, MCS; mental component summary, RCS; role/social component summary
GSRSは過敏性腸症候群や消化性潰瘍患者を対象とした質問票として開発された3)4).その後回答形式が改良され妥当性が高められ,逆流性食道炎に対する利用も普及した11)14).我が国では本郷ら3)によって日本語版に翻訳され臨床研究のアウトカムとして利用可能である.本研究ではGSRSについて,上部消化管の術後障害・QOLの評価尺度としての妥当性を計量心理学的に検証し,以下の3点の重要な結果を得た.まず,GSRSの各項目得点の平均値は全体として低く,強い床効果がある.第二に,臨床所見が重症な患者はGSRSの下位尺度得点が全体として高い傾向にあったが,術式,内視鏡所見,栄養指標などの外的基準との関連が少なく,known-groups妥当性があるとはいえなかった.第三に,SF-12のサマリースコアとGSRS得点は高い相関を認めず併存的妥当性があるとはいえなかった.
GSRSは逆流性食道炎や消化性潰瘍に対する疾患特異的QOL尺度としての一定の妥当性が証明されているが,今回の研究対象とした胃および食道癌の術後症状に特異的なQOL尺度としては妥当性を示すことができなかった.たとえば,外的基準として臨床的にはQOLと深い関わりがあると考えられる栄養指標はGSRSの得点との関連が乏しく,術式間の得点差も全体として小さかった.
このようにknown groupsの検定結果が臨床的知見と乖離する第一の原因はスコア分布の強い床効果と欠測データの増加である.ほとんどの項目で,回答が1または,2に偏っており,正規分布をしていない.また,予想に反して逆流のスコア差が小さかった胃全摘と幽門側胃切除術の比較では質問項目3は「胃酸の逆流のために……」という記述になっているため,胃全摘後の患者の一部はたとえ逆流症状を有していても厳密には「胃酸」の逆流ではないと考えている可能性が考えられた.実際に胃全摘後患者では項目1,3,4,7のように「胃」という言葉が入っている質問に対して欠測値を多く認めた(Fig. 2).床効果の影響は既存研究においても同様に認められ,Konoら10),Miyoshiら8)の胃全摘術における空腸パウチ作成の有用性に関する研究では,いずれの結果もパウチの有無にかかわらずGSRS尺度得点が低く,両群の比較が困難になっている.Namikawaら9)の幽門側胃切除後の再建術式を比較した研究においてもほとんどの下位尺度スコアが2未満となっており術後の消化器症状が全く出現しないかのような結果になっている.群間のスコア差を比較する際には床効果が強く統計学的検定に限界があること,欠測データが多くなれば検出力が低下することを考慮すべきである.
第二に,手術後患者の症状やQOL概念をGSRSが想定している構成概念の妥当性である.GSRSが計測する五つの下位概念は本来過敏性腸炎や消化性潰瘍を想定して作成されたものであるが,上部消化管術後患者にはダンピング症状や,腸液の逆流,小胃症状,創部の痛みなど特異的な障害が出現する.GSRSの下位尺度スコアに低下が見られないのは,上記のような術後特異的な障害を意識した質問項目が不足しており,対象集団が問題とするQOL項目のプロファイルが不適合なためである.尺度の妥当性が低いというよりも尺度に対する対象集団の選択が誤っていると考えられる.
第三に回答形式の問題点がある.GSRSは,自覚症状の有無を問うのではなく,症状が存在するという前提で,その症状によってどれくらい「困ったか」を記入する回答形式である.この形式では項目の消化器症状はあったがそれほど困らなかったということを意味しているのか,症状自体が無かったのかが区別できない.つまり酸逆流や腹痛が「あった/無かった」もしくは「強かった/弱かった」ということを調べることはできないことに注意が必要である.このことは術後患者にとって重大な問題である.GSRSの妥当性が示された内科疾患の症状と異なり,手術の前後で劇的な症状の出現および食生活の変化を経験し,以後は時間をかけて徐々に症状に適応していく.今回の調査では術後経過時間が平均19.8か月であり,患者は症状への対処法をある程度身につけていることが予想される.一定の症状はあっても「それほど困っていない」との回答数が増加し,結果としてスコア差が少なくなった可能性がある.また,術後患者におけるQOLとは,単に症状の程度だけではなく従来の生活を制限することで症状を緩和しようとすることの負担をも含む概念であると考えられる.単に消化器症状によって困っているか困っていないかではなく,嗜好に合わせた食事ができているか,栄養摂取や体力維持に必要な生活負担,それにともなう精神的な負担(睡眠や不安感など)や社会活動(仕事や家事,交友環境など)の制限など,日常生活における負担の内容を,より具体的に調査する項目が必要であろう.
GSRSはいくつかの消化器疾患において確立したQOL尺度であるが,胃癌・食道癌後患者を対象とした臨床研究のアウトカムとしては,内容的および計量心理学的妥当性は低いと考えられた.消化器外科領域においては,さまざまな低侵襲手術,縮小手術などを評価するために利用可能な,より妥当性の高い尺度が必要不可欠である.今後,上部消化管術後に特異的な症状およびQOLの評価尺度を新たに開発していく予定である.
利益相反:なし