医療情報学
Online ISSN : 2188-8469
Print ISSN : 0289-8055
ISSN-L : 0289-8055
原著
情報検索尺度Okapi-BM25と交換可能語ペアを用いた自動ICDコーディングに関する研究
荒牧 英治今井 健梶野 正幸美代 賢吾大江 和彦
著者情報
ジャーナル フリー

2007 年 27 巻 1 号 p. 101-107

詳細
抄録
 ICDコーディングは,保健・福祉行政の企画,人口問題,さらには,それらの国際比較という重要な目的を持つ.しかし,同時に時間 / コストがかかる作業であり,可能な部分においては自動コーディングする技術が待ち望まれている.本研究は,標準病名マスターの病名とそれに付与されたICDコードを材料に,標準病名マスターに収載されない病名に対して自動コーディングを目指す.
 提案手法は,まず,入力病名と類似した病名を標準病名マスターから検索する.次に,検索結果の上位の標準病名がもつICDコードの投票を行うことにより,入力病名のコードを決定する.
 類似度を検索する際には,情報検索モデルOkapi-BM251)を用いた.ただし,BM25(をはじめとする多くの検索モデル)は,個々の語が独立に分類に影響すると考えており,複数の語が組み合わさって生み出される影響を捉えることはできない.しかし,実際の病名においては,このような現象が多く存在する.例えば,「頭部熱傷」と「顔面熱傷」はともに同一コード(T200)を持ち,「熱傷」を含む病名においては,「頭部」と「顔面」は無視可能な差異となっている.本研究では,このようなある語と共起した場合に交換可能な語ペアの知識を自動抽出し,その知識を用いて検索を行う.
 実験の結果,44.0%の精度で適切なICDコードを付与可能であった.また,特に5語以上の長い病名に対しては,より高い精度(精度50.8%)で分類可能であった.本研究により,情報検索アプローチによるICDコーディングの可能性示すことができたと考える.
著者関連情報
© 2007 一般社団法人 日本医療情報学会
前の記事 次の記事
feedback
Top