案例 | 数据预处理方法 | 数据挖掘核心算法 | 拓展内容 |
窃漏电行为的识别 | 清洗、缺失值、属性变化、构建样本指标 | 神经网络,决策树 | 水量预测、水用户行为预测 |
电信公司用户数梳理 | 清洗、缺失值、数据变换 | RMF模型, K-Means聚类 | 航空系统客户群的梳理 |
水质图片分类 | 识别图片数据,转换成RGB三阶矩数据,转换数据、构建变量的属性、 | LM神经网络模型 | 其他分类模型,其他图片识别如人脸识别系统,职务叶子系统等 |
财政收入影响因素分析 | 清洗、缺失值、 属性变化,变量构建 | Lasso变量选择模型 | 因素分析模型 |
商超用户情感分析和购物智能推荐系统 | 数据清洗、数据转换、 文本分词、文本分析 构建属性 | Apriori关联规则 | 爬虫知识、影评、社会舆情分析、网络入侵技术分析、教育数据管理 |