算法2. 基于粗糙集的主成分聚类算法

输入:数据集C,聚类数K,阈值 α

输出:样本集合的聚类 C

步骤1:在C中随机选取K个样本,记作 { μ 1 , , μ K } ,作为聚类中心;

步骤2:计算剩余的每个样本 x j 与每个聚类中心 μ i ( 1 i K ) 的距离 d j i d j i = x j μ i 2 ,若 d j i α ,将样本划分到类簇 C i 的上近似中,若 d j i < α ,将样本划分到类簇 C i 的下近似中;

步骤3:重新计算已经得到的各个类的聚类中心 μ i μ i = 1 | C i | x C i x ,令 μ i = μ i ,得到聚类结果 C ( t ) ,聚类中心为 { μ 1 , , μ K }

步骤4:迭代步骤2和步骤3,直到新的聚类中心不再发生变化或迭代次数达到最大为止,输出 C = C ( t )