抄録
電子カルテシステムの普及により,テキスト形式の医療情報が蓄積される.我々はこれら医療情報の自然言語処理を支援するために,形態素解析器MeCab用の実践医療用語辞書ComeJisyoを作成し,現在登録語数77,760語のComeJisyoV5-1を公開している.
また医療施設で蓄積された誤字を含む医療情報を自然言語処理する上で,医療情報にどのような誤字が含まれるのか詳細を知ることは重要である.そこで,倫理的配慮のなされた2施設の医療情報に含まれる誤字の調査を行い,53種の誤字について分析したところ,ローマ字⇒仮名⇒漢字の2 段階の変換作業の中で,仮名⇒漢字の変換作業での誤変換が多く,46種が同音異字または同音異義語に誤変換されたものであることがわかった.