K平均值聚类的分析步骤
第1步,选择初始凝聚点和初始分类,比如取 k 个初始凝聚点,将每个样本(或变量)初始分成 k 类。
第2步,计算初始 k 个类均值(重心),然后对所有样本逐一计算它到初始 k 类的距离(通常用欧氏距离作为样本到凝聚点的距离)。若某样本到它原来所在类的距离最近,则它仍在原类。否则,将它移动到和它距离最近的那一类,并重新计算失去该样品的那个类重心以及接收该样品的那个类的重心,即再重新计算每一类的均值(重心)作为该类的凝聚点。
第3步,重新计算第2步骤直到所有的样本都不能移动为止,或者说如果某一步所有的新凝聚点与前一次老凝聚点重合,则计算过程终止。对有些问题经过不断修改和迭代,直到分类比较合理或迭代稳定,可终止计算。