電気関係学会九州支部連合大会講演論文集
平成23年度電気関係学会九州支部連合大会(第64回連合大会)講演論文集
セッションID: 07-2A-06
会議情報

大規模記事データベースでのキーワード情報のメタ記述
川端 健士金子 邦彦
著者情報
会議録・要旨集 フリー

詳細
抄録
MeCabをインストールし、Ruby上で動作させ、数千を超える大規模記事データベースを処理し解析、考察を行う。連番の大量の解析対象のファイルを自動読み込みできるようプログラムを組み、MeCabのわかち書き機能を用いて日本語文書を単語ごとに区切る。そこから機能語を除き内容語のみを抽出し、統計処理を行うことでデータベースの一般的な性質と特徴を考察し、キーワード情報をメタ記述する上での高効率化や障壁について考える。また、実験結果から生じる不特定多数によって書かれた大規模なデータベースを扱うがゆえの問題を発見し、どのようにその問題に対して取り組んでいけばよいか洞察を行う。
著者関連情報
© 2011 電気関係学会九州支部連合大会委員会
前の記事 次の記事
feedback
Top