常用方式

描述

优、缺点

Binary Relevance

将多标签分类问题进行分解, 转换为n个二元分类问题,每个二元 分类器对应一个待预测的标签

优点:实现方式简单;当标签之间不存在相关的依赖关系时, 模型效果较佳

缺点:当标签之间存在相关的依赖关系时,模型的泛化能力较弱;需要构建n个二分类器,当n比较大时,需要构建得模型也比较多

Classifier Chains

将多标签分类问题转换为一个二元分类器链 的形式,其中后链的二元分类器的构建是 在前面分类器预测结果的基础上的

优点:容易实现;当考虑标签之间的依赖关系时,模型的泛化 能力相对于Binary Relevance方式构建的模型效果要好

缺点:很难找到比较适合的标签依赖关系

Calibrated Laber Ranking

将多标签分类问题转换为标签的排序问题, 最终的标签就是排序后最大的几个标签值

优点:考虑了标签两两组合的情况,最终模型的泛化能力相对 来说比较好

缺点:只考虑两两标签的组合,没有考虑到标签与标签之间的 所有依赖关系