2022 年 42 巻 1 号 p. 3-15
診療録には所見など自由記載テキストにのみ記録される重要な情報が存在し,これを自動抽出する技術が求められている.実用的な技術開発の促進のためには,記載されている診療情報を名詞句といった文法的な形式によらず網羅するようなアノテーションが付いたコーパスが必要であるが,現在そのようなコーパスは存在しない.われわれは患者状態に関する網羅的なアノテーションを付与した症例報告コーパスを構築し公開した.本稿ではそのアノテーション基準の制定について報告する.症例報告へのアノテーションとアノテーション基準の修正を繰り返した結果,50種のエンティティタイプ,14種の属性,36種の関係からなるアノテーション基準が得られ,先行研究よりも詳細な情報が表現できるだけでなく,これまで表現できなかった事実性の時間的変化を捉えられるようになった.