2025 年 37 巻 1 号 p. 530-534
本論文では,国会での議論内容を要約・可視化するための第一歩として,BERTベース分類器を用いて国会会議録の発言文を役割ごとに分類する手法の有効性を検証する.実際の国会会議録の発言文に「導入」,「根拠」,「意見」,「質問」,「今後」の役割タグを付与したデータセットを構築し,BERTベースの分類器を用いて発言文を「意見」と「非意見」の2値に分類する実験を行った.その結果,地方議会会議録と国会会議録とWikipediaで事前学習を行ったモデルでは87.08%,日本語の幅広いデータで事前学習を行ったモデルでは74.72%の分類精度となった.BERTベースの分類器を用いると720文程度の学習データでも8割以上の精度で意見文を分類できることが明らかになった.また,事前学習に用いたデータの特徴が分類結果に反映されていることが示唆された.