凝聚层次聚类与分裂层次聚类的区别
在给定n个对象的数据集后,可用层次方法(Hierarchical Methods)对数据集进行层次分解,直到满足某种收敛条件为止。按照层次分解的形式不同,层次方法又可以分为凝聚层次聚类和分裂层次聚类:
凝聚层次聚类:又叫自底向上方法,一开始将每个对象作为单独的一类,然后相继合并与其相近的对象或类,直到所有小的类别合并成一个类,即层次的最上面,或者达到一个收敛,即终止条件为止。
分裂层次聚类:又叫自顶向下方法,一开始将所有对象置于一个簇中,在迭代的每一步中,类会被分裂成更小的类,直到最终每个对象在一个单独的类(簇)中,或者满足一个收敛,即终止条件为止。
层次方法最大的缺陷在于,合并或者分裂点的选择比较困难,对于局部来说,好的合并或者分裂点的选择往往并不能保证会得到高质量的全局的聚类结果,而且一旦一个步骤(合并或分裂)完成,它就不能被撤销了。