抄録
近年,病院情報システムの普及に伴い,検査や診療にかかわる数値・テキストデータが容易に蓄積され,EBM(Evidence Based Medicine:科学的根拠に基づく医療)の実現や診療の質の向上のためシステム上のデータやオンラインの文書に存在する有用な事実を理解するための活用法が求められている.しかしながら,退院時サマリーなど病院情報システムに蓄えられた文書には,患者の診療に関わる検査結果および医師や看護師の知識や経験が記述されているにも関わらず,データの記述内容に踏み込んだ活用は進んでいない.
以上の問題に対し,我々は,記述内容に時系列関係が定義された退院時サマリーから患者の病状経過に関する時系列関係規則を抽出する方法を提案する.
このため,データの前処理においてテキストから医学用語と診療行為に関わる語彙の抽出を行い,退院時サマリーからの特徴的な語彙間の関係抽出を行うマイニング手法を実装した.本稿では,島根大学医学部附属病院から提供された退院時サマリーを対象に病状経過に関連する時系列関係規則を抽出し,有用な時系列関係規則の発見が可能であることを示す.また,本手法により抽出される関係規則から得た語彙を用い,従来の重要語彙抽出法による検索との比較評価実験を行い,蓄積された文書から検索者の意図する内容の文書が従来の重要語彙と同等の性能で検索可能であることを示す.