2024 年 Annual62 巻 Abstract 号 p. 103_1
近年、深層学習の発展に伴い、医療現場における医療データの分類や疾患検知の精度は飛躍的に向上してきている。現状、深層学習による医療データの分類等を行う場合には、偏りのない多くの学習データが必要であるが、個人情報が含まれているデータは入手難易度が高いため、十分なデータ量を確保できない場合がある。そこで、本研究では、PhysioNetで公開されている大規模実心電図データセット(PTB-XL, a large publicly available electrocardiography dataset)を利用し、ノイズ除去拡散確率モデルを用いてECGデータの擬似的な生成を試みた。学習データには、健常な心電図、不完全な右脚ブロック、左心室肥大、下心筋梗塞、非特異的なST-T波変化の5種類の心電図データを使用する。各心電図データ数はそれぞれ、9432、800、1120、1600、1600である。各データの80 %は学習用データとして使用し、残りの20 %は検証用データとして使用する。尚、サンプリング周波数は100 Hzである。前処理として、時系列長が1024になるように抽出し、最大値が1、最小値が0になるように正規化処理を施した。生成された心電図波形の評価には、動的時間伸縮法(DTW)、無相関検定の2種類を用いた。