電子化した退院サマリーからテキストマイニングによって疾患別の重要語を抽出し,これをもとに退院サマリーの文章から疾患名を特定できるかについて検討した.千葉大学医学部附属病院病院情報システムに保存された退院サマリーの中から臓器別の代表13疾患4,317症例を選んで文書を形態素解析し,ベクトル空間モデルを用いて7,918の診療に関連する索引語を抽出した.その抽出結果から疾患毎の重要語を選出した.次に390症例の退院サマリーから疾患名を特定する実験を行った.その結果390症例中290症例(74%)が退院時サマリーの診断と一致した.さらにこれらの例に対してデンドログラムを作成して分類の視覚化を試みたところ,医学的に順当な結果を得た.以上の結果からテキストマイニングにより診療文書内容から疾患の特定,類似症例の検索,さらに疾患の再分類などの可能性が示唆された.