K-Medoids算法:什么意思、具体方法、优点缺点
K-Medoids算法看起来和K-Means算法比较相似,但是二者是有区别的,即中心点的选取。在K-Means算法中,我们将中心点取为当前cluster中所有数据点的平均值,在 K-Medoids算法中,我们将从当前中选取这样一个点——它到其他所有(当前cluster中)点的距离之和最小——作为中心点。
K-Medoids算法的具体方法如下。
(1)任意选取k个对象作为Medoids(O 1 ,O 2 ,…,O i ,…,O k )。
(2)将余下的对象分到各个类中(根据与Medoid最相近的原则)。
(3)对于每个类(O i )中,顺序选取一个O r ,计算用O r 代替O i 后的消耗——E(O r )。选择E最小的O r 来代替O i 。这样k个Medoids就改变了。
(4)重复第(2)、第(3)步直到k个Medoids固定下来。
K-Medoids 算法不容易受到那些由于误差等原因产生的脏数据的影响,但计算量显然要比K-Means大,一般只适合小数据量。
