医学検査
Online ISSN : 2188-5346
Print ISSN : 0915-8669
ISSN-L : 0915-8669
原著
肺機能検査予測値に対する信頼性の検討
海野 貴史若狭 伸尚伊勢澤 真里子池田 聡川上 直樹齋藤 和人
著者情報
ジャーナル フリー HTML

2021 年 70 巻 4 号 p. 669-675

詳細
Abstract

肺機能検査の予測値は性別・身長・年齢によって求められるが,生活環境の変化などを考慮し定期的な見直しが必要であると考える。本研究は日本呼吸器学会が2001年に報告した予測値から2014年に報告した予測値(JRS2014)に変更した場合の肺活量(VC),努力肺活量(FVC),1秒量(FEV1)に対する信頼性の評価及び系統誤差を知ることを目的とする。またアメリカ胸部学会でも推奨されている正常下限値(LLN)も含め検討を行ったので報告する。相対信頼性の評価はLandisの基準でalmost perfectであった。予測値変更による影響は,男性でVC(−0.55%~7.59%),FVC(−2.45%~6.25%),FEV1(−8.48%~3.30%),女性でVC(−1.08%~10.33%),FVC(−0.44%~14.55%),FEV1(−2.28%~14.70%)に収まることが推定された。またVC低下患者検出にはJRS2014,LLNで評価することで検出数は有意に増加した。気流閉塞患者検出にはLLNを用いることで男性では検出数が増加したが,女性では差を認めなかった。予測値変更の際には変更後の影響を知ることが重要である。また呼吸器疾患早期発見には新しい指標を用いることも検討する必要があると考えられた。

Translated Abstract

Lung function test reference values are determined on the basis of gender, age, and height. Therefore, they must be reviewed regularly to accommodate changes in the living environment. In this study, we evaluated the relative reliability and systematic bias associated with vital capacity (VC), forced vital capacity (FVC), and forced expiratory volume in one second (FEV1) after the lung function test reference values reported in 2001 by the Japanese Respiratory Society were revised in 2014 (JRS2014). This study is aimed at determining the errors associated with the previous values. We also evaluated the lower limit of normal (LLN) recommended by the American Thoracic Society. On the basis of the Landis criteria, the relative reliability of these revised reference values was “Almost Perfect.” The reference values were changed as follows: VC, −0.55% to 7.59%; FVC, −2.45% to 6.25%; and FEV1, −8.48% to 3.30% in males, and VC, −1.08% to 10.33%; FVC, −0.44% to −14.55%; and FEV1, −2.28% to −14.70% in females. Using the JRS2014 reference values and LLN to detect patients with decreased VC led to a significant increase in the number of detections. The use of LLN to detect airflow obstruction in patients resulted in a significant increase in the number of detections in males but not in females. When changing reference values, it is important to determine the resultant effect after the change. Furthermore, the use of a new factor for the early detection of respiratory diseases should be considered.

I  はじめに

肺機能検査の予測値は性別・年齢・身長によって求められるが,人種・民族間によっても異なる。そのため予測値は同じ人種・民族間の健常者から作成されるべきであり,生活環境の変化を考慮し定期的な見直しが必要であると考えられる。予測値に関する国外の動向としては2008年,世界規模での予測値作成を目的にGlobal Lung Function Initiative(GLI)が設立された。GLIは2012年,LMS法1)による多人種間の肺機能検査予測値,正常下限値(lower limit of normal; LLN)を報告している2)。日本国内においても2014年,日本呼吸器学会(The Japanese Respiratory Society; JRS)からLMS法による日本人の肺機能検査予測値(JRS2014)が報告された3)。しかし現在日本では,「じん肺法改正に伴う肺機能障害認定基準」「身体障害者手帳における呼吸機能障害の認定」において,JRSが2001年に報告した予測値(JRS2001)4)での申請が求められている。このため多くの施設ではJRS2001が使用される状況にある。

本研究の目的は,予測値としてJRS2014を使用した場合の肺活量(vital capacity; VC),努力肺活量(forced vital capacity; FVC),1秒量(forced expiratory volume in one second; FEV1),に対する信頼性の評価及び系統誤差を知ることである。またVC低下をJRS2014,JRS2001,LLNで評価した場合,予測値が変わることで結果にどのような影響が出るか検討すると共に,気流閉塞に対しても1秒率(FEV1/FVC)を70%未満の固定値またはLLNを用いて評価することで結果がどのように変わるか影響を知ることを目的とする。

II  対象及び方法

1. 対象

対象期間は2018年1月から12月(12ヶ月間)。当院生理機能検査室においてCHESTAC-8900,CHESTAC-33を使用し肺機能検査を行った3,327例中,17歳未満の35例,90歳以上の24例,適切に検査が行えず参考値として報告した6例を除外した3,262例(男性2,001例,女性1,261例)を対象とした。対象者には複数回検査を受けた患者も含まれる(Table 1)。

Table 1  患者背景と予測値
男性 女性
患者数(人) 2,001 1,261
年齢(歳) Mean ± SD(Range) 67.3 ± 12.8(17–89) 63.8 ± 15.5(17–89)
高齢者(60歳以上)(%) 79.3 68.9
検査依頼・呼吸器内科(%) 32.9 28.9
検査依頼・呼吸器外科(%) 9.2 10.2
身長(cm) Mean ± SD(Range) 165.2 ± 6.7(146.5–192.5) 152.5 ± 7.2(124.0–174.5)
VC(L) Mean ± SD(Range) 3.29 ± 0.88(0.59–6.76) 2.41 ± 0.64(0.57–4.77)
VC予測値(JRS2001)(L) Mean ± SD(Range) 3.63 ± 0.51(2.36–5.92) 2.55 ± 0.44(1.42–3.89)
VC予測値(JRS2014)(L) Mean ± SD(Range) 3.76 ± 0.49(2.51–6.01) 2.66 ± 0.42(1.64–3.85)
FVC(L) Mean ± SD(Range) 3.25 ± 0.89(0.66–6.92) 2.40 ± 0.67(0.49–4.60)
FVC予測値(JRS2001)(L) Mean ± SD(Range) 3.54 ± 0.50(2.30–5.80) 2.41 ± 0.45(1.30–3.77)
FVC予測値(JRS2014)(L) Mean ± SD(Range) 3.60 ± 0.49(2.08–6.01) 2.57 ± 0.42(1.55–3.77)
FEV1(L) Mean ± SD(Range) 2.40 ± 0.81(0.41–6.08) 1.90 ± 0.52(0.45–3.84)
FEV1予測値(JRS2001)(L) Mean ± SD(Range) 2.89 ± 0.52(1.69–5.16) 1.94 ± 0.44(1.01–3.28)
FEV1予測値(JRS2014)(L) Mean ± SD(Range) 2.80 ± 0.44(1.87–5.16) 2.05 ± 0.39(1.25–3.32)

2. 方法

1) 予測値

JRS2001はJRS肺生理専門委員会が1,811名の非喫煙者を対象に重回帰分析より求めた予測式4)を使用した。JRS2014,LLNはJRS肺生理専門委員会が20,341名の非喫煙者を対象にLMS法を用いて解析した予測式3)を使用した。またJRS2014の予測式は日本呼吸器学会ホームページからExcel fileを取得し使用した。尚,検討は男女に分け行うこととした。

2) 解析

統計解析にはmedcalc,EZR(Ver. 1.27)を使用した。はじめに正規性を確認するためにKolmogorov-Smirnov検定を行った。その後VC,FVC,FEV1に対し,JRS2001からJRS2014に予測値を変更した場合の相対信頼性及び絶対信頼性の評価を行った。相対信頼性の評価には級内相関係数(intraclass correlation coefficients; ICC),Pearsonの積率相関係数を用いた。しかし相対信頼性の評価では「測定値が内包する誤差を偶然誤差に限定していること」「誤差の種類と量に関する情報を得ることができないこと」の2つの問題点が上げられる5)。そこで絶対信頼性の評価としてBland-Altman分析を行った6)。加算誤差は,差の95%信頼区間(95% coefficient interval; 95% CI)に0を含まない場合,加算誤差ありと判断した。比例誤差はBland-Altman plotから回帰式を算出し,回帰の有意性が認められた場合,比例誤差ありと判断した。また誤差の許容範囲(limit of agreement; LoA)が求められるが,加算誤差と比例誤差両者を認めた場合,相対軸プロット(%LoA)に変更し解析を行った6)

さらに予測値の違いやLLNで評価した場合の結果に与える影響を知るため,VC低下群と気流閉塞群に対し検討を行った。VC低下の定義としてJRS2001,JRS2014は実測値がVC予測値の80%未満である場合,LLNは実測値がLLN未満である場合とした。解析はVC低下群とVC正常群に分けCochran Q検定,McNemar検定を行った。McNemar検定で求めたp値はBonferroni法による多重比較の補正を行った。気流閉塞の定義はFEV1/FVCが70%固定値未満である場合,LLNはFEV1/FVCがLLN未満である場合とした。解析は気流閉塞群,正常群に分けMcNemar検定にて解析を行った。相関性の有無はLandisの基準7)を用い,危険率5%未満(p < 0.05)を統計学的有意差ありとした。

尚,本研究は土浦協同病院倫理委員会の承認を得て実施した(承認番号2021FY114)。

III  結果

男女のVC,FVC,FEV1は正規性であることを確認した。

1. 相対信頼性の評価

JRS2001,JRS2014から求めた患者予測値(mean ± SD)はTable 1に示す。相対信頼性の評価として行ったICC,Pearsonの積率相関係数はVC,FVC,FEV1全てにおいて男女共に,Landisの基準でAlmost perfect,モデル適合性をみる決定係数(R2)も良好な結果を得た(Table 2)。

Table 2  相対信頼性の評価
項目 性別 級内相関係数 Pearsonの積率相関係数
ICC(r) 95%信頼区間 slope 決定係数(R2) 相関係数 95%信頼区間 p-value
VC 男性 0.988 0.987~0.989 0.957 0.976 0.988 0.987~0.989 < 0.001
FVC 男性 0.987 0.986~0.988 0.965 0.974 0.987 0.986~0.988 < 0.001
FEV1 男性 0.993 0.992~0.994 0.850 0.986 0.993 0.992~0.994 < 0.001
VC 女性 0.986 0.984~0.987 0.938 0.971 0.986 0.984~0.987 < 0.001
FVC 女性 0.982 0.980~0.984 0.909 0.965 0.982 0.980~0.984 < 0.001
FEV1 女性 0.994 0.993~0.994 0.886 0.987 0.994 0.993~0.994 < 0.001

2. 絶対信頼性の評価

Bland-Altman分析では男性のVC,FVCは正の加算誤差,FEV1は負の加算誤差を認め,全項目で比例誤差を認めた。予測値の変化を%LoAからみた場合その変化はVC(−0.55%~7.59%),FVC(−2.45%~6.25%),FEV1(−8.48%~3.30%)の間に収まることが推定された。女性はVC,FVC,FEV1で正の加算誤差を認め,全項目比例誤差を認めた。また%LoAから予測値の変化はVC(−1.08%~10.33%),FVC(−0.44%~14.55%),FEV1(−2.28%~14.70%)の間に収まることが推定された(Table 3)。

Table 3  絶対信頼性の評価
項目 性別 Bland-Altman分析
加算誤差(Fixed bias) 比例誤差(Proportional bias)
差の95%CI(L) 差の有無 誤差の許容範囲(LoA)(L) 相対軸plot(%LoA) 回帰直線の傾きslope 差の有無
VC 男性 0.12~0.13 −0.03~0.28 −0.55~7.59 −0.03 p < 0.001
FVC 男性 0.06~0.07 −0.10~0.22 −2.45~6.25 −0.02 p < 0.001
FEV1 男性 −0.09~−0.08 −0.27~0.10 −8.48~3.30 −0.16 p < 0.001
VC 女性 0.11~0.12 −0.03~0.26 −1.08~10.33 −0.05 p < 0.001
FVC 女性 0.16~0.17 −0.01~0.34 −0.44~14.55 −0.08 p < 0.001
FEV1 女性 0.11~0.11 −0.02~0.24 −2.28~14.70 −0.11 p < 0.001

3. VC低下群の比較

各年齢(年代)ごとの症例数とVC低下患者数はTable 4に示す。VC低下群として抽出された患者は男女共に三群間で有意差を認めた(p < 0.001, Figure 1)。続いてpairwiseによる比較を行ったが男女共に全ての組み合わせにおいて有意差を認めた(p < 0.001, Figure 1)。

Table 4  各年齢(年代)ごとの症例数とVC低下患者数
男性の年齢(年代) 17–19 20–29 30–39 40–49 50–59 60–69 70–79 80–89 割合
年齢(年代)ごとの症例数 6 29 56 122 202 569 753 264 2,001
JRS2001(VC 80%未満の症例数) 1 3 12 24 39 144 237 71 531 26.5%
LMS2014(VC 80%未満の症例数) 0 1 11 27 42 184 287 87 639 31.9%
LMS2014(LLN未満の症例数) 1 3 15 33 52 205 328 108 745 37.2%
女性の年齢(年代) 17–19 20–29 30–39 40–49 50–59 60–69 70–79 80–89 割合
年齢(年代)ごとの症例数 15 28 70 124 155 318 402 149 1,261
JRS2001(VC 80%未満の症例数) 2 8 6 12 20 63 97 41 249 19.7%
LMS2014(VC 80%未満の症例数) 2 6 6 13 26 95 137 52 337 26.7%
LMS2014(LLN未満の症例数) 3 6 8 21 32 103 136 45 354 28.1%
Figure 1 VC低下群に対する比較

Cochran Q検定で有意差を認めたためMcNemar検定による二群間比較を行った。P値はBonferroni法による多重比較の補正(p × 3)を行ったが全ての組み合わせにおいて有意差を認めた。

4. 気流閉塞群の比較

各年齢(年代)ごとの症例数と1秒率低下患者数はTable 5に示す。気流閉塞群として抽出された患者に対しpairwiseによる比較を行った結果,男性はFEV1/FVC 70%未満で評価した方がより多くの気流閉塞患者を検出したが(p < 0.001, Figure 2),女性ではFEV1/FVC 70%未満とLLN未満どちらで評価しても差はないという結果となった(p = 0.477, Figure 2)。

Table 5  各年齢(年代)ごとの症例数と1秒率低下患者数
男性の年齢(年代) 17–19 20–29 30–39 40–49 50–59 60–69 70–79 80–89 割合
年齢(年代)ごとの症例数 6 29 56 122 202 569 753 264 2,001
FEV1/FVCが70%未満の症例 0 0 2 12 32 158 291 102 597 29.8%
FEV1/FVCがLLN未満の症例 0 2 6 16 34 137 220 67 482 24.1%
女性の年齢(年代) 17–19 20–29 30–39 40–49 50–59 60–69 70–79 80–89 割合
年齢(年代)ごとの症例数 15 28 70 124 155 318 402 149 1,261
FEV1/FVCが70%未満の症例 0 0 1 5 8 31 74 25 144 11.4%
FEV1/FVCがLLN未満の症例 1 1 8 9 13 36 59 19 146 11.6%
Figure 2 気流閉塞群に対する比較

男性はMcNemar検定で有意差を認めたが,女性は有意差を認めなかった。

IV  考察

肺機能検査は画像診断検査や生検による組織・細胞診検査とともに呼吸器疾患の診断において重要な役割をもつ8)。肺機能検査で得られる主な測定指標は性別,年齢,体格(身長,ときに体重,体表面積)をもとに作成された予測値が存在し,VCやFEV1は予測値に対する対標準指標(%VC, %FEV1)で結果を評価している。そのため,使用する予測値の違いは結果に大きな影響を与える場合がある3),9),10)。JRS肺生理専門委員会はJRS2014を発表するにあたり男性170 cm,女性155 cmとした場合の予測値の比較を報告している。その中でJRS2001からJRS2014に予測値を変更した場合,男性ではVC,FVCが増加しFEV1は減少する,女性はVC,FVC,FEV1が増加すると報告している3)。今回我々が行ったBland-Altman分析からも男性のVC,FVCは正の加算誤差,FEV1は負の加算誤差,女性はVC,FVC,FEV1で正の加算誤差を認めており,同様の結果となった。また我々はBland-Altman分析を行うことで全項目での比例誤差の存在も明らかとした。比例誤差の存在は予測値が大きい患者ほど変更した後のバラツキも大きくなることを意味する。これらのことから予測値を変更した後の%VC,%FEV1はvolumeが大きい患者ほど注意が必要であると考えられた。

また実際に予測値を変更した場合の影響についても検討を行った。今回の検討ではJRS2014に予測値を変更することで男女共に有意にVC低下患者は増加した(Table 4, Figure 1)。これはBland-Altman分析からも分かるように予測値が増加したことが要因であり,過去の予測値を用いることはスクリーニングの段階でVC低下と判断されるべき患者を検出できていない可能性が示唆された。

さらにLLNとの検討も行った。呼吸生理学では1960年代初頭より予測値の ±20%をカットオフとすることが報告されて以降,長年予測値に対する80%未満を基準範囲外としてきた。しかし固定値を使用することには問題点11),12)が指摘されており,アメリカ胸部学会(American Thoracic Society; ATS)ではLLNでの表記が推奨されている13)。JRSが使用しているLLNは,ATS及びヨーロッパ呼吸器学会(European Respiratory Society; ERS)でも推奨されている予測値の5パーセンタイル(Z score = −1.64)が使用されている。このLLNを用いて行った検討では男女共にJRS2014に比べより多くのVC低下患者を検出することができた。これらのことから固定値を用いるだけでなくLLNを併記することは,より多くのVC低下患者を検出することができ,スクリーニングにおいて有用な指標となる可能性が示唆された。

気流閉塞を評価する場合,男性はFEV1/FVC 70%未満で評価したほうがLLN未満に比べ,より多くの気流閉塞患者を検出することができたが,女性では検出患者数に差はないという結果となった(Table 5, Figure 2)。有意差が出た男性群を見てみると60代以降ではFEV1/FVC 70%未満で評価したほうが多くの気流閉塞患者を検出している。このことから気流閉塞患者を検出するには,FEV1/FVC 70%未満を用いた方が良いと思われるが,GOLD(Global Initiative for Chronic Obstructive Lung Disease)は2007年に70%未満の固定値を使用することは,高齢者の潜在的な過剰診断につながると報告している14)。これは高齢者ではFEV1/FVCが70%未満であっても真の有病者でない可能性を意味する。またFirdausら15)が行った気流閉塞患者検出と予後に関するメタ解析においても,現段階ではどちらの評価方法が優れているかは結論づけられないと報告している。これらのことから気流閉塞を評価する場合においても,FEV1/FVC 70%未満の固定値,LLN未満どちらかのみで評価するのではなく両者を併記し,一方が下限を下回った場合は機能的残気量検査や肺拡散能検査,動脈血液ガス分析などを行い精査していく必要があるのではないかと考える。

V  結語

呼吸器疾患のスクリーニング検査である肺機能検査において予測値は重要なものである。新しい予測値を使用する際には変更後の影響を知ることが重要であると考える。また呼吸器疾患の早期発見にはLLNなどの新しい指標も取り入れる必要があると考えられた。

COI開示

本論文に関連し,開示すべきCOI 状態にある企業等はありません。

文献
 
© 2021 一般社団法人 日本臨床衛生検査技師会
feedback
Top