日本臨床薬理学会学術総会抄録集
Online ISSN : 2436-5580
第43回日本臨床薬理学会学術総会
セッションID: 43_3-C-P-096
会議情報

一般演題 ポスター
多種疾患情報を用いたGANによる合成医療データの生成
*宮野 咲紀関 弘翔辻 泰弘尾上 知佳大場 延浩松本 宜明細野 裕行
著者情報
会議録・要旨集 フリー

詳細
抄録

【目的】臨床試験をはじめとする医薬品開発では,試験条件に合致する対象患者の選定に難渋する場合が多く,対象例数を確保するために費やされる膨大な時間や資金が問題となっている.従って,医薬品開発における効率化(リスクやコストの軽減,スピードアップ)は喫緊の課題である.この課題に対し本研究は,大規模な医療情報データから合成患者生成器を構築し,患者属性が制御可能な合成患者の生成を目的としている.そこで,敵対的生成ネットワーク(GAN)を用いることで医療情報データベースから年齢,性別,身長,体重,肝および腎機能に至るまで,患者を構成する特徴を学習できるという仮説を立て,多種疾患医療情報データを用いてGANを学習し,臨床試験に適用可能とする合成患者の生成を試みた.

【方法】GANの学習には,MDV(株)より購入した慢性腎臓病(695,424名),認知症(917,868名),2型糖尿病(354,001名),肺がん(451,027名),リウマチ(370,527名),移植(165,268名)の6疾患データおよび(株)JMDCの健診受診者(12,099,049名)を利用し,各データからランダムに100症例ずつ抽出したものを使用した.GANの生成器は,患者属性として性別,年齢およびBMI,臨床検査値としてALT,ASTおよびSCRを生成するように構築した.これらを用いて,損失関数や識別器の構造を変更した複数の条件でGANを学習し,検証のために各パターンで500件の合成データを生成した.また,次元削減とクラスタリングを組み合わせて実データと合成データとの類似度を算出し,類似度が高いエポックのものを最良の生成器として選択した.妥当性は各属性の分布および相関を用いて評価した.

【結果・考察】GANの識別器にミニバッチ標準偏差(MSD)を取り入れることで,生成の難しいALTおよびASTのモード崩壊を抑制する効果が見受けられた.さらに,類似度によりエポックを選択することで,生成した合成データのALTおよびASTがより実データに近い分布を持つことが確認できた.

【結論】識別器にMSDを取り入れたGANを,多種疾患医療情報データを用いて学習した.次元削減およびクラスタリングを用いて最良なエポックを選択した.これによって,実データと合成データの近似性の可視化が可能になり,類似度が高い合成データを生成できた.

著者関連情報
© 2022 日本臨床薬理学会
前の記事 次の記事
feedback
Top