抄録
自然言語表現を統制用語集にマッピングすること(正規化)は,診療録等の利活用に必須の技術である.本稿では正規化技術の確立に向け,身体部位表現の内部構造モデルを提案する.提案モデルは言語学分野で蓄積されてきた知見に基づいた語形成過程を表すものであり,要素語,要素語の分類体系,要素語の合成規則,辞書から構成される.このモデルによって,これまで扱うことが難しかった「胸椎+腰椎=胸腰椎」のような縮退を表現することができ,また表層文字列のみならず要素語間の関係も表現されるため修飾語の付加による意味変化に対して頑健な処理の実現が可能である.評価のため提案モデルに基づいた内部構造解析プログラムを作成し解剖学用語80語を対象に適用したところ,73語に対して正しい内部構造が得られ,本モデルの表現力およびこれに則った解析の実現可能性が示唆された.