主催: 一般社団法人 人工知能学会
会議名: 2024年度人工知能学会全国大会(第38回)
回次: 38
開催地: アクトシティ浜松+オンライン
開催日: 2024/05/28 - 2024/05/31
企業内で日々蓄積される労働災害の報告書は,原因分析,再発防止策の策定,安全教育などに利用することができる.しかし,これらのテキストデータは構造化されておらず,効率的な知識の蓄積と再利用を阻む原因となっている. 本研究ではこれらの文書を構造化し,再利用可能な有益な知識として蓄積することを目的とした. 本実験では,電力会社で発生した労働災害の報告書に関するテキストデータに対し,汎用LLMであるGPTを用いてテキスト含意を基にしたマルチラベルアノテーションを計4つのアプローチで行った.またアノテーションタスクに使用する事故の原因の抽象カテゴリ自体もゼロショットでGPT-4から抽出し,それを人間の専門家がチェックをすることでラベルを決定した. 実験の結果,特にプロンプトエンジニアリングを用いたワンショットのアプローチにおいて,GPTは強力な一般化能力を発揮し,一部の評価指標において人間のアノテーターと同じレベルに肉薄する有望な性能を示した. しかし同時に,本研究のように専門性が高く,多面的複数の要素が絡まりあう事例を扱う際は,モデルの選択やプロンプト設定に慎重な調整が求められることも示唆された.