人工知能学会全国大会論文集
Online ISSN : 2758-7347
第34回 (2020)
セッションID: 1D3-GS-13-05
会議情報

SDGs日本語データセット及び分類タスクベースラインの作成
*張 鑫本木 悠介曽根岡 侑也岩澤 有祐松尾 豊
著者情報
会議録・要旨集 フリー

詳細
抄録

SDGs(持続可能な開発目標)は社会システムや産業構造を変えている現在、アカデミーによる取組が求められるようになってきた。しかし、日本語リソースが少ないため日本での取組が困難であった。本研究では、日本語のSDGs関連データを大学が公表している資料から集め、データセットを作成した。そして、SDGs分類モデルを構築した。オーギュメンテーション手法として、1. BERT MASKモデルを用いて品詞置き換え 2. Google transferを用いて英訳したものを再度日本語訳した逆翻訳手法 を用いた。古典機械学習手法であるトピックモデル(LDA等)及び深層学習モデルであるBERT等を用いて分類を行った。結果は少数データタスクにおいてオーグメンテーションの成果を示す。また、データ数が少ない中で比較的に高い精度を出すことを目指す。

著者関連情報
© 2020 一般社団法人 人工知能学会
前の記事 次の記事
feedback
Top