Algorithm1属性加权的独依赖条件概率编码方法

Input:分类属性 A 1 c , , A M c c ,数值属性 A M c + 1 n , , A M n 和标签c.

Output:编码后的数值属性 A 1 , , A M c 和对应的权重 w = [ w 1 , , w M c ]

begin

//独依赖条件概率编码

1:计算TAN-tree获得属性之间的依赖关系。

2:for每一对分类属性 A j c 和它的父属性 A j p c , j=1 to Mc do

3: for每一个可能的标签c do

4: 通过公式 计算数值概率向量 a j ( x i ( c ) )

5: end for

6:end for

7:由步骤2 to 6, 我们得到每一个分类属性对应的数值向量并替换,分类属性 A 1 c , , A M c c 可被编码为数值属性 A 1 , , A M c

//属性加权

8:for每一对分类属性 A j c 和其它属性 A k c , j=1 to Mc, k=1 to Mc, j k do

9: for每一个可能的标签c do

10:通过公式(16)~(23)计算所有属性之间的条件互信息值。

11: end for

12:end for

13::通过公式(24)~(26)所有分类属性的权重。

14;通过公式(10)将权重映射在区间[0, 1]中。

return编码后的数值属性 A 1 , , A M c 和对应的权重 w = [ w 1 , , w M c ]