BERTベース分類器を用いた国会会議録発言文の役割分類手法の検証

宮木 優太朗; 内田 ゆず

doi:10.3156/jsoft.37.1_530

抄録

本論文では，国会での議論内容を要約・可視化するための第一歩として，BERTベース分類器を用いて国会会議録の発言文を役割ごとに分類する手法の有効性を検証する．実際の国会会議録の発言文に「導入」，「根拠」，「意見」，「質問」，「今後」の役割タグを付与したデータセットを構築し，BERTベースの分類器を用いて発言文を「意見」と「非意見」の2値に分類する実験を行った．その結果，地方議会会議録と国会会議録とWikipediaで事前学習を行ったモデルでは87.08%，日本語の幅広いデータで事前学習を行ったモデルでは74.72%の分類精度となった．BERTベースの分類器を用いると720文程度の学習データでも8割以上の精度で意見文を分類できることが明らかになった．また，事前学習に用いたデータの特徴が分類結果に反映されていることが示唆された．

著者関連情報

お気に入り & アラート

閲覧履歴

前身誌

日本ファジィ学会誌

責任著者(Corresponding author)

ファンド情報

1.助成機関/事業名: Japan Society for the Promotion of Science

2.助成機関/事業名: Japan Society for the Promotion of Science

J-STAGEへの登録はこちら（無料）