抄録
近年オントロジーが注目されている.しかしこれを人手で構築・メンテナンスを行うのは困難であり,自然言語処理を用いた構築支援手法の確立が求められている.本研究では,電子内科教科書を用い,画像診断における「疾患」と「それに関係する所見」との対応を抽出する手法を提案する.まず,教科書中の画像診断に関する解説文に対し,用語間の係り受け依存木を抽出する.次に,各文節内の自立語に対して医学的な属性を付与し,画像診断の所見情報を構成する部分木をすべて抽出する.最後に教科書の見出し語となっている各疾患名に対し,画像診断において関係する所見を「肯定的/否定的」の別を伴い,部分木から抽出する.実験の結果124個の疾患名に対して関係する所見794個が抽出できた.また,抽出精度の評価実験により再現率66%,適合率95%を得た.今後同様の手法を専門分野教科書に適用することで,さらなる効率的な関係抽出を行える可能性が示唆されたので報告する.