什么是聚类分析:聚类分析的例子与方法

2020年10月11日09:46:54什么是聚类分析:聚类分析的例子与方法已关闭评论

什么是聚类分析:聚类分析的例子与方法

聚类是指将数据集聚集成几个簇(聚类),使得同一个聚类中的数据集之间最大程度地相似,而不同聚类中的数据集最大程度地不同,利用分布规律从数据集中发现有用的规律。

例如,市场营销中可以将客户聚集成几个不同的客户群,从而发现客户群及其相应的特征,由此对不同的客户群采用不同的营销策略。

聚类与分类的区别在于,聚类不依赖于预先定义好的类,不需要训练集,因此通常作为其他算法(如特征和分类)的预处理步骤。常见的聚类方法有基于划分的方法、基于层次的方法、基于密度的方法、基于模型的方法和基于网格的方法等。

接下来介绍一种分层聚类的方法。

分层聚类是通过尝试“对给定数据集进行分层”达到聚类的一种分析方法。根据分层分解采用的分解策略,分层聚类法又可以分成凝聚的分层聚类和分裂的分层聚类。

凝聚的分层聚类:采用自底向上的策略,首先将每一个对象作为一个类,然后根据某种度量将这些类合并为较大的类,直到所有的对象都在一个类中,或者是满足某个终止条件时为止。目前,绝大多数分层聚类算法属于此类,而不同方法之间的区别在于类间相似度的定义方法有所不同。

分裂的分层聚类:采用与凝聚的分层聚类相反的策略——自顶向下,它首先将所有对象置于一个类中,然后根据某种度量逐渐细分为较小的类,直到每一个对象自成一个类,或者达到某个终止条件。

  • 版权声明:本篇文章(包括图片)来自网络,由程序自动采集,著作权(版权)归原作者所有,如有侵权联系我们删除,联系方式(QQ:452038415)。