労働安全衛生研究
Online ISSN : 1883-678X
Print ISSN : 1882-6822
ISSN-L : 1882-6822
調査報告
機械判読の観点からみた労働災害データベースの課題
濱島 京子
著者情報
ジャーナル フリー

2022 年 15 巻 2 号 p. 177-188

詳細
抄録

厚生労働省は,職場のあんぜんサイトにて労働災害の発生状況等を記載した「死亡災害データベース」および「労働災害(死亡・休業4日以上)データベース」をExcelデータで公開している.このExcelデータの機械判読性は高くなく,自然言語処理技術などのコンピュータプログラムを用いてデータを加工,編集,分析をする際に様々な問題が起こりやすいことが課題となっている.そこで,総務省が示した「統計表における機械判読可能なデータの表記方法の統一ルール」を援用し,機械判読上の問題点を調査した.さらに,定型データ項目における誤記や表記ゆれの状況等を把握した.そして,これら問題の具体的な内容を示した上で,不具合の発生を抑止するためにデータベースシステムを活用すべきこと,テキストファイルに記述可能な半構造化データ形式によるデータ公開を提言した.

著者関連情報
© 2022 独立行政法人 労働安全衛生総合研究所
前の記事 次の記事
feedback
Top