算法1. K-Means聚类

输入：数据集C，聚类数K

输出： $π_{K} = {C_{1}, \dots, C_{K}}$

步骤1：在C中随机选取K个样本，记作 ${μ_{1}, \dots, μ_{K}}$ ，作为聚类中心；

步骤2：计算剩余的每个样本 $x_{j}$ 与每个聚类中心 $μ_{i} (1 \leq i \leq K)$ 的距离 $d_{j i}$ ： $d_{j i} = {‖ x_{j} - μ_{i} ‖}_{2}$ ，并将其样本归到距离 $x_{j}$ 最近的中心 $μ_{i}$ 所在的类 $C_{i} = {x_{j} | d_{j i} \leq d_{j l}, l \neq i}$ ；

步骤3：重新计算已经得到的各个类的聚类中心 ${μ^{'}}_{i}$ ： ${μ^{'}}_{i} = \frac{1}{| C_{i} |} \sum_{x \in C_{i}} x$ ，令 $μ_{i} = {μ^{'}}_{i}$ ；

步骤4：迭代步骤2和步骤3，直到新的聚类中心不再发生变化或迭代次数达到最大为止。