日本臨床薬理学会学術総会抄録集
Online ISSN : 2436-5580
第44回日本臨床薬理学会学術総会
セッションID: 44_1-C-P-I2
会議情報

一般演題(ポスター)
拡散モデルによる多種疾患情報を制御した合成患者データ生成
*古田土 祐樹関 弘翔宮野 咲紀青山 隆彦辻 泰弘細野 裕行
著者情報
会議録・要旨集 フリー

詳細
抄録

【目的】新薬開発では、対照群を設置したランダム化比較試験(RCT)により薬の有効性・安全性を検証する。近年では、対照群の設置が難しい希少疾患の臨床試験に対して、外部の臨床試験データやRWDから合成した外部対照群を活用する取り組みが行われる。しかし、外部から取り入れる患者データが不足している場合、外部対照群の作成は困難となるため、患者データを増強させる手法が求められる。また、疾患ごとに患者群を選定し直す必要があり、多大な労力や時間を要する。この問題に対し本研究では、深層学習技術を患者データの生成に応用し、患者データの補強に貢献することを目的とする。そこで、表データ生成に対応した拡散モデルであるTabDDPMを用いて、患者データと疾患情報の関係を学習させ、任意の疾患を持つ患者データの生成を試みた。

【方法】MDV(株)より購入した慢性腎臓病、認知症、2型糖尿病、肺がん、リウマチ、移植の患者データから、各疾患100データずつ無作為に抽出し、全600データの実データを作成した。患者属性として性別、年齢、身長、体重、ALT、AST、SCRの7項目を採用した。実データとラベル付けした疾患情報を用いてTabDDPMの学習を行った。生成の際は任意のラベルを入力し、ラベルに対応した疾患情報を持つ合成患者データの生成を行うことができる。合成患者データが実データと同じ6種類の疾患で構成されるようにラベルを指定した。合成患者データの評価として、分布・相関を可視化させ、平均や標準偏差などの統計量を算出し、実データと比較した。また、合成患者データと実データの各疾患について同様に比較を行い、疾患情報の考慮具合を評価した。

【結果・考察】評価結果より、合成患者データは分布、相関及び統計量ともに実データに近い特性であることを示した。慢性腎臓病の評価として、実データは腎機能の指標であるSCRの平均値が他の疾患よりも1.90[mg/mL]高い数値であり、合成患者データは他の疾患よりも2.02[mg/mL]高い数値であった。また、認知症の場合では実データと同じ平均年齢83歳の分布で生成されており、合成患者データは各疾患の特性を考慮した結果となった。

【結論】6種類の疾患から構成される患者データを用いてTabDDPMの学習を行い、合成患者データの生成および評価について取り組んだ。結果として、合成患者データは実データに近い特性であり、任意の疾患を持つ患者データの生成を可能にした。

著者関連情報
© 2023 日本臨床薬理学会
前の記事 次の記事
feedback
Top