抄録
近年、階層的クラスタリングは多くの研究者によってさまざまな手法が研究されている。
しかし、非対称なデータを想定した手法の研究はあまり行われていない。
そこで、非対称データを想定した、非対称類似度を用いる平均結合法を提案する。
また、マルチセットを用いた非対称類似度でのテキストマイニングの手法を提案する。
階層的クラスタリングの出力で用いられる樹形図には反転が生じるとうい問題点がある。反転が生じると樹形図からクラスターの分割を得るのが困難となる。
これらの出力の樹形図に反転が生じないことを証明する。
Twitterデータ等の実データを用いた数値例を示す。