労働安全衛生研究
Online ISSN : 1883-678X
Print ISSN : 1882-6822
ISSN-L : 1882-6822

この記事には本公開記事があります。本公開記事を参照してください。
引用する場合も本公開記事を引用してください。

機械判読の観点からみた労働災害データベースの課題
濱島 京子
著者情報
ジャーナル フリー 早期公開

論文ID: JOSH-2022-0009-CHO

この記事には本公開記事があります。
詳細
抄録

厚生労働省は,職場のあんぜんサイトにて労働災害の発生状況等を記載した「死亡災害データベース」および「労働災害(死亡・休業4日以上)データベース」をExcelデータで公開している.このExcelデータの機械判読性は高くなく,自然言語処理技術などのコンピュータプログラムを用いてデータを加工,編集,分析をする際に様々な問題が起こりやすいことが課題となっている.そこで,総務省が示した「統計表における機械判読可能なデータの表記方法の統一ルール」を援用し,機械判読上の問題点を調査した.さらに,定型データ項目における誤記や表記ゆれの状況等を把握した.そして,これら問題の具体的な内容を示した上で,不具合の発生を抑止するためにデータベースシステムを活用すべきこと,テキストファイルに記述可能な半構造化データ形式によるデータ公開を提言した.

著者関連情報
© 2022 独立行政法人 労働安全衛生総合研究所
feedback
Top