日本知能情報ファジィ学会 ファジィ システム シンポジウム 講演論文集
第24回ファジィ システム シンポジウム
セッションID: FA1-3
会議情報

自然言語処理によるレポート類似判定システムの開発
*伊藤 宏隆都築 賢二松尾 啓志
著者情報
会議録・要旨集 フリー

詳細
抄録

著者らはコース管理システムMoodle上で動作する自然言語処理によるレポート類似判定システムを開発した。従来のレポート類似判定法として、TF・IDFを用いるベクトル解析がある。TFは単語の出現頻度、IDFは単語が出現する文書の分布に着目する。ベクトル解析による類似判定は実装上、問題がある。 著者らは新たにBloom Filterを用いた類似判定法を開発した。Bloom FilterはBurton h. Bloomが1970年に考案した確率的データ構造であり、任意のデータdが集合のメンバーXに含まれるかどうかの判定に用いられるアルゴリズムである。Bloom Filterを文書中のある単語が既出かどうかを調べるために用い、類似判定に利用する。 本論文では、従来のベクトル解析による類似判定法を説明する。従来手法の実装上の問題点を明らかにし、Bloom Filterによる類似判定法について詳述する。

著者関連情報
© 2008 日本知能情報ファジィ学会
前の記事 次の記事
feedback
Top