Algorithm1属性加权的独依赖条件概率编码方法

Input：分类属性 $A_{1}^{c}, \dots, A_{M_{c}}^{c}$ ，数值属性 $A_{M_{c} + 1}^{n}, \dots, A_{M}^{n}$ 和标签c.

Output：编码后的数值属性 ${A^{'}}_{1}, \dots, {A^{'}}_{M_{c}}$ 和对应的权重 $w = [w_{1}, \dots, w_{M_{c}}]$ 。

begin

//独依赖条件概率编码

1：计算TAN-tree获得属性之间的依赖关系。

2：for每一对分类属性 $A_{j}^{c}$ 和它的父属性 $A_{j p}^{c}$ , j=1 to M_c do

3： for每一个可能的标签c do

4：通过公式计算数值概率向量 $a_{j} (x_{i}^{(c)})$ 。

5： end for

6：end for

7：由步骤2 to 6, 我们得到每一个分类属性对应的数值向量并替换，分类属性 $A_{1}^{c}, \dots, A_{M_{c}}^{c}$ 可被编码为数值属性 ${A^{'}}_{1}, \dots, {A^{'}}_{M_{c}}$ 。

//属性加权

8：for每一对分类属性 $A_{j}^{c}$ 和其它属性 $A_{k}^{c}$ , j=1 to M_c, k=1 to M_c, $j \neq k$ do

9： for每一个可能的标签c do

10：通过公式(16)~(23)计算所有属性之间的条件互信息值。

11： end for

12：end for

13：：通过公式(24)~(26)所有分类属性的权重。

14；通过公式(10)将权重映射在区间[0, 1]中。

return编码后的数值属性 ${A^{'}}_{1}, \dots, {A^{'}}_{M_{c}}$ 和对应的权重 $w = [w_{1}, \dots, w_{M_{c}}]$ 。