分层聚类算法:什么意思、例子案例
分层聚类算法是对给定的待聚类数据集合进行层次化分解。举一个例子,如图13-9所示的是事件x 1 ~x 5 的距离矩阵。
图13-9
其中,x 2 和x 3 的距离为1,是最小的,故可以先将x 2 和x 3 分为一类;x 1 和x 4的距离为2,仅次于x 2 和x 3 的距离,故再将x 1 和x 4 分为一类;x 2 和x 5 的距离为3,是剩余距离中最小的,故将x 2 和x 5 分为一类,以此类推。
连接步骤示意图如图13-10所示。
图13-10
如图13-11所示,如果想将x 1 ~x 5 分为5类,则在直线1处划分,x 1 ~x 5 各为一类;如果想将x 1 ~x 5 分为4类,则在直线2处划分,即x 2 和x 3 为一类,x 1 、x 4、x 5 各为一类;如果想将x 1 ~x 5 分为3类,则在直线3处划分,x 2 和x 3 为一类,x1 、x 4 为一类,x 5 为一类;如果想将x 1 ~x 5 分为两类,则在直线4处划分,x 2 、x3 、x 5 为一类,x 1 和x 4 为一类。
图13-11

