抄録
近年、クラスタリングはさらに重要な技術として多くの場面で使われるようになり、そのアルゴリズムはより複雑で高度なものとなっている。一方で、クラスタリングは一種の最適化問題であるため、その評価関数が決定されれば、評価関数の最大化(または最小化)問題となる。このような評価関数による指標は、Cluster validity index(CVI)と呼ばれる。CVIに関する研究は、クラスタリングそのものに関する研究よりも少なく、また、体系化についても十分議論されていない。そこで、本発表では、CVIの歴史をまとめ、CVIの特性を整理し、既存の指標の体系化を試みる。