2023 年 30 巻 3 号 p. 935-958
医療分野には,電子カルテや退院サマリといった症例テキストが蓄積されており,これらを新たな知識の発見に繋げるために自然言語処理技術を応用する研究が試みられている.しかし,症例テキストには専門的な複合語が頻出するといった解析の難しさがあり,日本語の症例テキストを用いた深い意味解析や,日本語の症例テキスト間の含意関係認識についての研究は発展途上である.そこで本論文では,日本語の高度な意味解析・推論システム ccg2lambda に複合語解析モジュールを追加することで,症例テキストの意味解析と推論を扱える論理推論システム Medc2l を提案する.複合語解析モジュールは (i) 症例テキストに含まれる複合語の抽出,(ii) 複合語を構成する形態素間の意味的な関係を表す意味現象タグの付与,(iii) 意味現象タグに基づく複合語の構文解析,(iv) 意味現象タグに基づく複合語の意味解析から構成される.(ii) では (i) で抽出した複合語に対して意味現象タグのアノテーションを行い,系列変換モデルの学習によって構築した複合語意味現象タグ分類モデルを用いる.(iii) では予測された意味現象タグを元に複合語の構造を CFG 解析したのち CCG 部分木に変換し,(iv) では (iii) の CCG 部分木に基づいて高階論理の意味表示を導出する.日本語の症例テキストを用いて推論データセットを構築し,提案システムの評価を行った結果,深層学習による含意関係認識モデルと同等またはそれ以上の性能を示し,とくに non-entailment のケースを正しく予測する傾向が見られた.