Step 1:从集中数据信息中随机选择 K 0 个样本作为原始聚类算法管理中心 C = { C 1 , C 2 , , C k 0 }

Step 2:对于每个集中的数据信息模板,将其计算到聚类算法管理中心C。将其间距分类到由聚类算法管理中心以最小间距匹配的聚类中

Step 3:要区分每个类别中的元素数量是否少于该数量,必须丢弃该类别,设置K = K − 1,并将该类别中的样本分配给其余类别中距离最小的类;

Step 4:对于每种类型 c i ,重新计算它的聚类中心 c i = 1 | c i | x c i x (即属于该类的所有样本的质心)

Step 5:如果当前 K K 0 2 ,表示当前类型的数量太少,则销毁实际操作;

Step 6:如果当前 K 2 K 0 ,表示今天有太多类型,请分解实际操作;

Step 7:如果迭代更新频率较高,则停止,否则返回第2步;