社会技術研究論文集
Online ISSN : 1882-4609
Print ISSN : 1349-0184
ISSN-L : 1349-0184
研究論文
文書クラスタリングによるトピック抽出および課題発見
橋本 泰一村上 浩司乾 孝司内海 和夫石川 正道
著者情報
ジャーナル フリー

2008 年 5 巻 p. 216-226

詳細
抄録

自然言語処理技術を応用し,分析対象となる新聞記事を取得して,記事を自動的に分類し,トピックとなる社会事象を抽出,さらにはトピックを構造化して課題の発見に至る手続きを可能とする手法を開発した.この手法によれば,多数のトピックを含む文書集合に対して階層的クラスタリングを施し,クラスタ間の語彙使用の類似性に基づく構造化を行い,個々のクラスタについてこれを要約するキーワードおよび関係する主体(組織名)を自動抽出することによって内容を効率的かつ経済的に俯瞰できることを示した.本論文では,産業活動に伴う事故・災害に関する社会の課題発見を事例として,これらのテキストマイニング技術を統合した社会変化の定量的分析手法の有効性について検証した.

著者関連情報
© 2008 社会技術研究会
前の記事
feedback
Top