算法2. 基于粗糙集的主成分聚类算法

输入：数据集C，聚类数K，阈值 $α$

输出：样本集合的聚类 $C^{*}$

步骤1：在C中随机选取K个样本，记作 ${μ_{1}, \dots, μ_{K}}$ ，作为聚类中心；

步骤2：计算剩余的每个样本 $x_{j}$ 与每个聚类中心 $μ_{i} (1 \leq i \leq K)$ 的距离 $d_{j i}$ ： $d_{j i} = {‖ x_{j} - μ_{i} ‖}_{2}$ ，若 $d_{j i} \geq α$ ，将样本划分到类簇 $C_{i}$ 的上近似中，若 $d_{j i} < α$ ，将样本划分到类簇 $C_{i}$ 的下近似中；

步骤3：重新计算已经得到的各个类的聚类中心 ${μ^{'}}_{i}$ ： ${μ^{'}}_{i} = \frac{1}{| C_{i} |} \sum_{x \in C_{i}} x$ ，令 $μ_{i} = {μ^{'}}_{i}$ ，得到聚类结果 $C^{(t)}$ ，聚类中心为 ${μ_{1}, \dots, μ_{K}}$ ；

步骤4：迭代步骤2和步骤3，直到新的聚类中心不再发生变化或迭代次数达到最大为止，输出 $C^{*} = C^{(t)}$ 。