大規模言語モデルを用いた労働災害の原因推論

中村 真士; 岩松 秀俊; 伏屋 貴文; 服部 雅典; 速水 悟; 寺田 和憲

doi:10.11517/pjsai.JSAI2024.0_4F3GS303

抄録

企業内で日々蓄積される労働災害の報告書は，原因分析，再発防止策の策定，安全教育などに利用することができる．しかし，これらのテキストデータは構造化されておらず，効率的な知識の蓄積と再利用を阻む原因となっている．本研究ではこれらの文書を構造化し，再利用可能な有益な知識として蓄積することを目的とした．本実験では，電力会社で発生した労働災害の報告書に関するテキストデータに対し，汎用LLMであるGPTを用いてテキスト含意を基にしたマルチラベルアノテーションを計4つのアプローチで行った．またアノテーションタスクに使用する事故の原因の抽象カテゴリ自体もゼロショットでGPT-4から抽出し，それを人間の専門家がチェックをすることでラベルを決定した．実験の結果，特にプロンプトエンジニアリングを用いたワンショットのアプローチにおいて，GPTは強力な一般化能力を発揮し，一部の評価指標において人間のアノテーターと同じレベルに肉薄する有望な性能を示した．しかし同時に，本研究のように専門性が高く，多面的複数の要素が絡まりあう事例を扱う際は，モデルの選択やプロンプト設定に慎重な調整が求められることも示唆された．

著者関連情報

お気に入り & アラート

閲覧履歴

責任著者(Corresponding author)

会議情報

J-STAGEへの登録はこちら（無料）