2019 年 31 巻 2 号 p. 645-652
本研究では,地方議会会議録に含まれるテキストの発言箇所を自動で推定する.実験のデータセットは,平成23年4月から平成27年3月までの4年間の4つの自治体の議会会議録であり,青森県,東京都,大阪府,福岡県の会議録に対して,人手で発言文と発言以外の文にアノテーションを行った.「4年間のデータを利用した発言文の推定実験」では,学習データと評価データに「同一自治体のデータ」を利用した実験,および,「異なる自治体のデータ」を利用した実験を行なった.実験の結果,SVMの平均正解率が最も高く,それぞれ,0.985,0.951となった.また,少量の学習データによる「1年間のデータを利用した推定実験」では,LSTMとSVMの比較を行った.比較実験の結果,LSTMの平均正解率が0.926となりSVMの平均正解率よりも6.1ポイント上回る結果となった.