自然言語処理
Online ISSN : 2185-8314
Print ISSN : 1340-7619
ISSN-L : 1340-7619
交通事故事例に含まれる事故原因表現の新聞記事からの抽出
酒井 浩之梅村 祥之増山 繁
著者情報
キーワード: 情報抽出, 原因表現抽出
ジャーナル フリー

2006 年 13 巻 2 号 p. 99-123

詳細
抄録

新聞記事に含まれる交通事故事例の記事から事故原因を表す表現 (例えば, 「ハンドル操作を誤った」) を自動的に抽出する手法を提案する.抽出結果に基づき交通事故事例の原因を分析することで, 例えば交通事故防止装置の開発に役立てることができる.本手法では, まず, 前処理としてSupport Vector Machines (SVM) を用いて新聞記事コーパスから交通事故事例の記事を抽出し, 抽出された交通事故事例の記事から事故原因を表す表現を, 新聞記事コーパスから得られる統計的な情報を使用して抽出する.具体的には, 事故原因を表す表現がいくつか係る表現を種表現と定義して人手で1つ与え, 種表現に係っている事故原因表現を自動的に取得する.そして, 取得したいくつかの事故原因表現から自動的に種表現を取得し, さらに, 取得した種表現から再び事故原因表現を取得する.このプロセスを繰り返すことで, 事故原因表現, および, その種表現を取得していく.本手法を評価したところ, 事故原因表現抽出の精度は77.2%であり, 再現率は38.6%であった.また, 事故原因表現, および, 種表現を共に含んでいる文, もしくは, 事故原因表現に「らしい」が追加された表現を含む文を原因文と定義し, その抽出精度, 再現率を求めたところ, 精度が87.2%, 再現率が40.8%であった.

著者関連情報
© 言語処理学会
前の記事 次の記事
feedback
Top