算法1 SMOTE-ENN伪代码

Input 数据集 D

Output 平衡数据集 BD

1: foreach获得数据集D少数类mp的数据样本do

2: 计算少数类数据样本的K近邻 K m p i

3: 构造新的合成数据样本 m p new = m p i + ( m p i ^ m p i ) + δ

4: 将生成的 m p new 加入到数据集D的 m p i

5: end for

6: foreach获得数据集D中的数据样本pdo

7: if pi <> K邻近的多数类 then

8: 将pi从数据集D中移除

9: end if

10: end for

11: return 平衡数据集BD