快速聚类的基本原理
快速聚类分析是聚类分析中使用较广的一种分析方法。它仍以距离衡量样本间的亲疏程度,但其最终结果不是聚成一类,而是根据各聚类中心,将所有样本点聚成指定的类数。
快速聚类法通过设置K个类的初始类中心点,计算所有样本数据点到K个类中心点的距离,按照距离最短的原则,将所有样本分派到各中心点所在的类中,形成一个新的K类,完成一次迭代过程。在下一次迭代过程中,重新计算K个类的类中心点,重复上述过程,直到达到指定的迭代次数或达到终止迭代的判断要求为止。
在进行聚类分析中,当样本量大于100时,有必要考虑快速聚类分析。因为在计算中,它比分层聚类分析所占用的内存更少,计算速度更快。