大規模地方議会会議録の分散表現を用いた地方議会のトピック分析

佐々木 稔; 乙武 北斗; 木村 泰知

doi:10.11517/pjsai.JSAI2020.0_4Rin159

抄録

本研究では，地方議会会議録に対して，地方議会でどのような話題が議論されているかについてテキストマイニング手法を利用した分析を行う．既存研究では話題の分析を行う際に，最も適切な単語単位はどの程度なのか，大規模な都道府県議会会議録から得られた単語の分散表現が利用可能なのかについて研究が行われていない．本稿では，NTCIR14 Segmentation task で利用されたデータセットを用いて，単語分割や学習データの違いにより，トピックモデルの結果がどの程度異なるのかについて分析を行った．その結果，単語分割については，Comainuを用いたことにより，固有名詞や複合名詞を扱えるようになり，トピックの意味が理解しやすくなり，ラベル付けが容易できることを確認した．学習コーパスについては，地方議会会議録を学習データとした分散表現を用いることで，細かな表現に対応できるこ可能性があることを確認した．しかしながら，異なる分散表現を用いたときのトピックには明確な違いを確認することができなかった．

著者関連情報

お気に入り & アラート

閲覧履歴

責任著者(Corresponding author)

会議情報

J-STAGEへの登録はこちら（無料）