医学検査
Online ISSN : 2188-5346
Print ISSN : 0915-8669
ISSN-L : 0915-8669
74 巻, J-STAGE-1 号
選択された号の論文の14件中1~14を表示しています
医療統計学
  • 佐藤 正一
    原稿種別: 医療統計学
    2025 年74 巻J-STAGE-1 号 p. 1-5
    発行日: 2025/04/04
    公開日: 2025/04/04
    [早期公開] 公開日: 2024/08/14
    ジャーナル フリー HTML

    そもそも“統計”とは何なのか。統計の定義については様々なものがある。それは統計を利用する立場によって異なるためである。統計学を大きく分類すると,大量のデータや資料をまとめる学問として記述統計学,数学的な見方でデータを捉える学問として数理統計学がある。数理統計学はさらに確率的(頻度的)推測統計学とベクトルや行列を使ってデータの関連性を探索する多変量解析に分類される。医療統計学の立場で考えると,臨床検査によって得られたデータのデータ数や代表値(平均値,中央値)およびそのバラツキなどから,傾向や特徴を見いだして資料としてまとめるとともに,将来に利用できる情報として活用するためのものと考える。医療統計学では,このような様々な統計学を巧みに使用することで,医療に貢献することが求められる。近年,ビッグデータ時代を迎え,ますます統計の重要度が増してきている。しかし,統計処理法には難解な部分や様々な前提条件があるため,誤用して結果をまとめていることも多い。そこでデータ処理をする際に誤りやすい点などを含め実例を示しながら基本統計について解説していく。

  • 佐藤 正一
    原稿種別: 医療統計学
    2025 年74 巻J-STAGE-1 号 p. 6-9
    発行日: 2025/04/04
    公開日: 2025/04/04
    [早期公開] 公開日: 2024/08/14
    ジャーナル フリー HTML

    正規分布は統計処理をするうえで基本となる重要な確率分布である。この分布は,自然界のさまざまな現象や性質,臨床データなどに対して当てはまる特徴を持った分布である。臨床検査の健常群の中で正規分布を示す項目には,Na,Ca,IP,尿酸,総蛋白,アルブミン,赤血球などがある。一方,正規分布ではない歪んだ分布(非正規分布)を示す検査項目も多数存在する。例えば,クレアチニン,コレステロール,AST,ALTなどは対数正規分布(データの対数をとったときに正規分布となる分布のこと)を示す。統計処理では,パラメトリック法を用いる際に母集団が正規分布していることが前提条件であり,平均や標準偏差はこの前提に基づいて計算することが可能である。対数正規分布のように正規分布ではないデータに対する対応は,データを一旦正規分布になるように変数変換を行い,平均値や標準偏差を求め,分析を行った後に逆変換することによって正規分布として扱うことで可能である。このような処理を行うことで,非正規分布データも適切に分析することが可能となる。ここでは対数変換を含め,t分布,一様分布などについて紹介する。

  • 佐藤 正一
    原稿種別: 医療統計学
    2025 年74 巻J-STAGE-1 号 p. 10-14
    発行日: 2025/04/04
    公開日: 2025/04/04
    [早期公開] 公開日: 2024/06/19
    ジャーナル フリー HTML

    統計処理の目的は,多くの情報を整理,分析して,表やグラフにまとめることで,データの裏側にある特徴を知り,将来に役立てることである。記述統計は,その基本となる統計学の一分野で,データをわかりやすくすることを目的としている。データを一つの数値で要約させる時には,平均値や中央値,最頻値といった代表値で表される。しかし,それぞれの代表値には特徴や前提条件があることから,適切な使い分けが必要である。また,データがどのような分布であるかを記述する際には,代表値のほか,データ数やバラツキの指標である標準偏差や変動係数,標準誤差,四分位数を使ってデータを表現する。しかし,これらも代表値と同じように,データの特徴によって使い分けが求められる。データ全体の特徴を知るうえでは,ヒストグラムや箱ひげ図が有効であり,データ分析を行う初期段階でデータの図示をすることで,極端値の混入が発見でき,極端値混入によってデータ解析を誤ってしまうことを未然に防ぐ効果がある。

  • 佐藤 正一
    原稿種別: 医療統計学
    2025 年74 巻J-STAGE-1 号 p. 15-20
    発行日: 2025/04/04
    公開日: 2025/04/04
    [早期公開] 公開日: 2024/06/19
    ジャーナル フリー HTML

    臨床検査における「基準値」は,結果の解釈や判断を行う上での重要な指標である。基準値は,一般的に基準範囲や臨床判断値である病態識別値(カットオフ値),治療目標値,予防医学値など,さまざまな指標が含まれるあいまいな用語であることに注意する必要がある。本文では,基準範囲を設定する際の基本的な統計手法について解説する。基準範囲は,健常者の中から選ばれた基準個体の検査値分布の95%信頼区間を基に設定される。「基準個体」とは,健常者からその検査値に明瞭な影響を与える状態(生理的変動因子)や病態を有する個体を可能な限り除外した健常者のことである。一方,血中成分の一部は正規分布に近似するものもあるが,多くは正規分布から対数正規分布の間の分布を示すことから,基準値の設定に際しては,正規分布になるようにべき乗変換を施行し,その後に95%信頼区間を算出する。算出された信頼区間を基に逆変換を行うことによって基準範囲が設定される。

  • 佐藤 正一
    原稿種別: 医療統計学
    2025 年74 巻J-STAGE-1 号 p. 21-25
    発行日: 2025/04/04
    公開日: 2025/04/04
    [早期公開] 公開日: 2024/06/19
    ジャーナル フリー HTML

    検定の基本的概念は,得られたデータが同一の母集団から得られたものであるかどうかを判定することにある。したがって,平均値の差の検定であれ,分散の差であれ,違いがあれば仮説を棄却し,差があると判断する。検定法は,背理法という証明方法を使って矛盾を導き出し,否定を証明する方法を用いる。得られたデータについて,正規分布が仮定できる場合はパラメトリック検定を行い,分布型が特定できない場合や正規分布が仮定できない場合にはノンパラメトリック検定を行う。そして,判定方法に方向性がある場合は片側検定,ない場合は両側検定を行う。さらに,αエラー(第一種の過誤),βエラー(第二種の過誤)の2種類の過誤の発生確率を理解し,コントロールしながら進める必要がある。また,検定結果はデータ数の影響を受けるため,データが多すぎると有意差が出やすくなる。統計的検定は複数の要素を考慮しながら慎重に進める必要がある。また,臨床的に意味のある差があるのかを判断することが求められる。

  • 佐藤 正一
    原稿種別: 医療統計学
    2025 年74 巻J-STAGE-1 号 p. 26-36
    発行日: 2025/04/04
    公開日: 2025/04/04
    [早期公開] 公開日: 2024/06/19
    ジャーナル フリー HTML

    検定とは,標本から抽出したデータを基に,ある確率を使って推定した母集団の特性を,バラツキの影響を考慮して統計的に判断することをいう。差の検定では,t検定や分散分析のようなパラメトリック法では,母平均の差について評価を行い,Mann-Whitney U検定やWilcoxonの符号順位検定などのノンパラメトリック法では順位を基に二変量間の差について検定を行う。また,等分散性の検定では標準偏差などのバラツキの大きさについて検定する。差の検定の手順は,帰無仮説(H0)として「等しい」という仮説と対立仮説(H1)「異なる」という2つの仮説を設定し,各検定方法の統計量を求め,統計量が設定した有意水準を上回った場合には,帰無仮説(H0)を棄却し,対立仮説(H1)を採用するという方法がとられる(背理法)。仮説が真であることを証明するのは難しいが,仮説が正しくないことを証明するのは可能であるため,背理法を用いる。また,検定では,その検定法を適用するための前提条件があり,使い方を誤ると最良の結果が得られないため,必要な前提条件を確認したうえで実行することが求められる。本章では,各種統計手法について,理論と具体的な例題を挙げて解説する。

  • 山西 八郎
    原稿種別: 医療統計学
    2025 年74 巻J-STAGE-1 号 p. 37-44
    発行日: 2025/04/04
    公開日: 2025/04/04
    [早期公開] 公開日: 2024/07/11
    ジャーナル フリー HTML

    目的変数;yと説明変数;xの平面上での直線関係を表す回帰直線を決定する方法として,xを基準とした最小二乗法が汎用されている。最小二乗法は回帰残差が最小となるように直線が決められるため,xからyを予測するためのもっとも適切な回帰式を与える。しかし,この最小二乗法からは,y軸方向の誤差だけを考慮した回帰式が得られるため,測定誤差を無視できない測定方法間比較に用いることは適切ではない。このような場合は2変量の誤差を仮定した標準主軸回帰,あるいはDeming回帰を用いる必要がある。特に前者は2変量の測定誤差が平等に反映された回帰式を与える。一方,ノンパラメトリック法に属するPassing-Bablok回帰は測定値の分布に依存しないため,飛び離れ値を有するデータセットに対しても適用できる。しかしその原理上,負の相関関係にある変量には適用できない。相関係数は2変量間の直線関係の程度を表す統計量で,一般的にピアソンの相関係数が用いられる。しかし,この方法はパラメトリックな方法であり,データの分布に歪みがある場合,また,極端な飛び離れ値が含まれると,見かけ上相関係数が大きく見積もられることがある。このような場合はノンパラメトリックな方法であるスピアマンの順位相関係数用いる。ただし,xの変化に対してyが増加と減少を示す場合は良好な相関指標とはならない。

  • 山西 八郎
    原稿種別: 医療統計学
    2025 年74 巻J-STAGE-1 号 p. 45-50
    発行日: 2025/04/04
    公開日: 2025/04/04
    [早期公開] 公開日: 2024/07/11
    ジャーナル フリー HTML

    検査(診断)法が疾患の診断にどの程度寄与するかを評価することを総称して判断分析といい,症例対照研究のような後ろ向き研究から得られたデータが解析対象となる。そして,その定量的な指標となるのが,感度,特異度,オッズ比などの統計量である。これらの統計量は,検査法が有する疾患群(判別群)と非疾患群(被判別群)の判別特性を評価するうえにおいて重要な指標となる。また,感度・特異度曲線はカットオフ値の候補点を与える。さらに,感度,特異度から得られるROC曲線の曲線下面積から,その検査法の判別能を定量的に評価,比較することができる。オッズ比は判別群と被判別群における注目するイベントが起こるオッズの比であり,オッズ比が大きいほど判別群に属する可能性が高いと判断することができる。一方,χ2検定は,観測度数と期待度数から統計検定量としてのχ2値を求め,対応する自由度のχ2分布との関係から,期待度数からの観測度数の偏りの有意性を検定する方法である。χ2検定は,χ2適合度検定と独立性の検定に大別される。前者は観測事象が生じる確率が既知の場合の検定法であり,後者は観測度数から期待度数を確率論的に設定する。

  • 山西 八郎
    原稿種別: 医療統計学
    2025 年74 巻J-STAGE-1 号 p. 51-58
    発行日: 2025/04/04
    公開日: 2025/04/04
    [早期公開] 公開日: 2024/07/11
    ジャーナル フリー HTML

    ベイズ統計は,18世紀にトーマス・ベイズにより発案された逆確率論を原点として発展した確率的推論である。一般的な統計学ともっとも異なる点は,標本から得られる(多数の)頻度に基づかない確率(事前確率)から事象の生起する確率(事後確率)を推定する点にある。したがって,推定(事後確率)の信憑性と信頼性は最初に仮定される事前確率と仮説の元で結果が生起する尤度の設定に依存しており,その主観的なプロセスが原因となり完全否定された時期があった。しかし,主観確率の正当性が数学的に証明された,現在ではベータ分布や正規分布などの確率変数の分布を事前確率とすることにより,コンピュータ通信におけるフィルタリング機能や,公衆衛生事業である死亡率,出生率の推定など多方面で応用されている。本セクションではベイズ統計の全容は網羅できていないが,確率記号を使うことなくベイズ統計の基本となるベイズ公式の仕組みを面積図により解説した。また,事前分布として仮定した一様分布がより複雑なベータ分布に更新されていく仕組みと事後確率の期待値について解説した。

  • 山西 八郎
    原稿種別: 医療統計学
    2025 年74 巻J-STAGE-1 号 p. 59-70
    発行日: 2025/04/04
    公開日: 2025/04/04
    [早期公開] 公開日: 2024/07/11
    ジャーナル フリー HTML

    重回帰分析は,複数の説明変数;xで目的変数;yを回帰する分析法であり,yの推定値を求めるための予測としての使い方と,yの変動要因となるxを特定するための要因分析としての使い方がある。xの係数(偏回帰係数)は,その変数が1単位変化したときのyの純粋な変化量を表している。重相関係数Rは回帰式から算出される目的変数の推定値と実測値との相関係数であり,赤池の情報量基準とともに回帰モデルの適合度指標となる。ただし,要因分析の場合は,モデルの適合度よりは偏回帰係数の有意性が問題となる。重回帰に対して,ロジスティック回帰分析は,目的変数としては「0/1」でコードされる2値型変数のみをとり,回帰式からは「1」でコードした目的変数(イベント)が生起する確率が算出される。回帰係数からは,その説明変数の変動に対するイベント生起のオッズ比が算出される。また傾向スコア分析における傾向スコアの算出にも利用されている。これらの多変量回帰分析は,単変量回帰での落とし穴となる交絡による目的変数と説明変数間の見かけの関連性を制御することができ,検査法,診断法の性能評価や治療効果の判定,さらに疾患と生活習慣との関係を解析するうえにおいて極めて有用な統計手法である。

  • 古賀 秀信
    原稿種別: 医療統計学
    2025 年74 巻J-STAGE-1 号 p. 71-77
    発行日: 2025/04/04
    公開日: 2025/04/04
    [早期公開] 公開日: 2025/02/13
    ジャーナル フリー HTML

    3群もしくはそれ以上の群のグローバル(一括)検定において,データが正規分布で等分散あれば一元配置分散分析(ANOVA),正規分布でなければKruskal-Wallis検定が用いられる。ANOVAでは全体の変動を群間変動(要因変動)と郡内変動(誤差変動)に分けて分散の比に続けて,F検定を行う。Kruskal-Wallis検定では,順位データを用いてH統計量を求め,(カテゴリ数 − 1)のカイ二乗分布に従うという性質を用いて要因間に差があるかどうかを調べる。ANOVAでもKruskal-Wallis検定でも検定の結果が有意となった場合,少なくとも1組の代表値が異なることを意味する。どの群間に差があるかを調べる場合,有意差がないのに有意差ありと判断するαエラー(第1種の過誤)を増やしてしまうため,2群比較の手法を何度も行うことはできず,αエラーを調整した多重比較で行わなければならない。また,共分散分析は,分散分析と共変量を組み合わせた手法である。共分散分析では,先ず交互作用の有無を確認する。交互作用を認める場合,層別解析が必要である。交互作用がなければ回帰直線の傾きがゼロでないことを確認したのち,水準間の分散分析,多重比較および各水準における母平均の区間推定を行う。これらの手法は研究で用いることも多く,研究者の理解と判断に基づいて適切に行われる必要がある。

  • 古賀 秀信
    原稿種別: 医療統計学
    2025 年74 巻J-STAGE-1 号 p. 78-83
    発行日: 2025/04/04
    公開日: 2025/04/04
    [早期公開] 公開日: 2025/02/13
    ジャーナル フリー HTML

    臨床研究において,要因と患者アウトカムに関する研究は関心が高い。患者を何日間観察した結果(入院患者であれば,それは在院日数に該当),「(軽快)退院した」もしくは「死亡した」という観察結果に関する情報は非常に重要である。ロジスティック回帰分析はアウトカムとその要因との関係を解析する代表的な解析手法であるが,観察期間が加味できない。生存時間解析には,生存時間を表した生存時間曲線(カプランマイヤー曲線)と,生存時間の比較であるログランク検定ならびに観察時間を加味した回帰分析であるCox比例ハザードモデルがよく用いられる。最低限必要なデータは,観察期間(時間・日・年 等)と2値であるアウトカムである。重症度や治療行為といった分類変数があれば生存時間曲線の比較(ログランク検定)が,さらに年齢,性別および入院時検査所見といった患者背景(共変量)があれば,生存時間の多変量回帰分析であるCox比例ハザードモデルを適用することができる。数理的な背景から理解すると難解になりがちだが,統計ソフトを用いることで簡単に解析を行うことができる。

  • 古賀 秀信
    原稿種別: 医療統計学
    2025 年74 巻J-STAGE-1 号 p. 84-94
    発行日: 2025/04/04
    公開日: 2025/04/04
    [早期公開] 公開日: 2025/02/13
    ジャーナル フリー HTML

    本稿は,臨床研究における時系列解析の重要性とその手法について述べる。臨床検査データは,複数回にわたり測定されることが一般的であり,時系列の特性を無視して単純な比較を行うことは,誤った結論を導く可能性が高い。このようなデータは,患者ごとに階層的な構造を持つため,通常の統計解析ではデータの変動を過小評価する可能性がある。この問題に対処するためには,マルチレベル分析を適用し,階層構造を考慮することが重要である。また,ある時点を境に治療手順やルールが変更された場合,その後のアウトカムの変化を解析するためには,分割時系列解析(ITSA)を用いることが有効である。特に,検査値などの連続変数においては,治療閾値を基準にアウトカムの変化を解析する回帰不連続デザインが適している。一方,周期性やノイズを含む時系列データの解析には,移動平均法,自己相関分析,ARIMAモデル(自己回帰和移動平均モデル)などの手法が用いられる。これらの手法は,データの時間的変動を考慮し,短期的な変動や長期的なトレンド,周期性などを明らかにすることができる。特にARIMAモデルは,自己回帰成分と移動平均成分を組み合わせることで,時系列データのトレンドや季節性を効率的に捉えることが可能であり,予測や変動の分析に適している。時系列解析の本質は,データの時間的構造を適切に評価し,時間軸に沿った変化を考慮して解析を行うことで,予測精度を向上させる点にある。本稿では,これらの解析手法が臨床研究における結果の信頼性向上や,データ解析の精度を高める上で不可欠であることを実際の事例に適用した例を挙げながら解説する。

  • 古賀 秀信
    原稿種別: 医療統計学
    2025 年74 巻J-STAGE-1 号 p. 95-102
    発行日: 2025/04/04
    公開日: 2025/04/04
    [早期公開] 公開日: 2025/02/13
    ジャーナル フリー HTML

    臨床研究を行う際には,研究に応じて臨床研究法,人を対象とする生命科学・医学系研究に関する倫理指針や個人情報保護法に則って行わなければならない。その中でも人を対象とする医学系研究に関する倫理指針は重要な指針である。臨床検査技師が行う臨床研究は,当然,臨床検査を軸とした発表が多いが,地域包括ケアの構築が進み,高齢者が増える中,医療のあり方や患者のニーズは大きくシフトしており,今後は患者や地域のoutcomeに着目した研究が求められる。その理解として,ドナベディアンモデル1)は全ての臨床検査技師が知っておくべき概念である。また研究を行う上でPECO,PICO(patient, exposure, intervention, comparison, outcome)といった研究の構造化や研究デザイン(研究の型)を事前に練り上げておくことが重要である。研究の型として分析的観察研究であれば,横断研究,コホート研究(前向き),コホート研究(過去起点)および症例対照研究がある。コホート研究が考え方の基本となる研究であるが,それぞれには一長一短があるため,研究の目的や行う上での制約などを加味した上で決めなければならない。研究成果を発表する際に抄録や論文を作成するが,今後はSTROBE(Strengthening the Reporting of Observational Studies in Epidemiology)声明に基づいた構造化抄録・構造化論文で作成することを目指すべきである。

feedback
Top