Algorithm1属性加权的独依赖条件概率编码方法 |
Input:分类属性 ,数值属性 和标签c. |
Output:编码后的数值属性 和对应的权重 。 |
begin |
//独依赖条件概率编码 |
1:计算TAN-tree获得属性之间的依赖关系。 |
2:for每一对分类属性 和它的父属性 , j=1 to Mc do |
3: for每一个可能的标签c do |
4: 通过公式 计算数值概率向量 。 |
5: end for |
6:end for |
7:由步骤2 to 6, 我们得到每一个分类属性对应的数值向量并替换,分类属性 可被编码为数值属性 。 |
//属性加权 |
8:for每一对分类属性 和其它属性 , j=1 to Mc, k=1 to Mc, do |
9: for每一个可能的标签c do |
10:通过公式(16)~(23)计算所有属性之间的条件互信息值。 |
11: end for |
12:end for |
13::通过公式(24)~(26)所有分类属性的权重。 |
14;通过公式(10)将权重映射在区间[0, 1]中。 |
return编码后的数值属性 和对应的权重 。 |