抄録
近年,病院情報システムの普及により,多くの診療情報が電子データとして蓄積されつつある.これに伴い,従来使用されていた紙文書を画像処理により XML へ自動変換して検索用のタグを付加し,類似症例検索に再活用するためのシステムが必要性とされつつある.そこで本研究では,表形式の退院サマリを対象とした文書認識と自動 XML 化ならびに類似症例検索のためのキーワード抽出・検索のためのプロトタイプシステムを試作し,評価実験と基礎的検討を行った.三重大学医学部附属病院にて使用されている退院サマリを用いて評価実験を行った結果,本システムを用いることにより,標準的な表形式文書画像から XML 文書を自動で作成できることが確認された.本稿では,筆者らが提案してきた表構造認識手法ならびに XML 生成手法等についてその詳細を述べ,試作したプロトタイプシステムの概要を紹介する.また,評価実験に加えて,表構造認識機能を持つ市販 OCR との比較実験も行い,本システムの類似症例検索システム構築への発展の可能性と現在の課題点についても議論する.