算法1. K-Means聚类
输入:数据集C,聚类数K
输出: π K = { C 1 , ⋯ , C K }
步骤1:在C中随机选取K个样本,记作 { μ 1 , ⋯ , μ K } ,作为聚类中心;
步骤2:计算剩余的每个样本 x j 与每个聚类中心 μ i ( 1 ≤ i ≤ K ) 的距离 d j i : d j i = ‖ x j − μ i ‖ 2 ,并将其样本归到距离 x j 最近的中心 μ i 所在的类 C i = { x j | d j i ≤ d j l , l ≠ i } ;
步骤3:重新计算已经得到的各个类的聚类中心 μ ′ i : μ ′ i = 1 | C i | ∑ x ∈ C i x ,令 μ i = μ ′ i ;
步骤4:迭代步骤2和步骤3,直到新的聚类中心不再发生变化或迭代次数达到最大为止。