序号 | 实验内容 | 教学要求 | 案例/项目 | 学时 |
1 | 爬虫 | 1) 掌握数据获取的常用方法 2) 掌握数据存储的基本格式 3) 掌握HTTP协议的基本概念 4) 掌握简单Python爬虫的方法 | 1) COVID-19数据的爬取 2) 新闻数据的爬取 3) 微博数据的爬取 | 6 |
2 | 数据清洗 | 1) 掌握数据清洗的基本概念 2) 掌握pandas包的使用技巧 | 1) COVID-19数据的清洗 2) 酒品消耗数据初步探索 | 6 |
3 | 数据 可视化 | 1) 掌握常用的数据可视化手段 2) 掌握matplotlib包的使用 3) 掌握seaborn包的使用 | 1) COVID-19数据的可视化 2) 亚马逊雨林数据的可视化 | 12 |
4 | 回归分析 | 1) 掌握线性回归的基本概念 2) 建立回归模型 3) 回归诊断分析 | 1) 使用回归构建房价预测系统 2) 使用回归模型预测鲍鱼年龄 | 9 |
5 | 机器学习 算法 | 1) 掌握机器学习的基本概念 2) 掌握sklearn包的使用 | 1) 基于机器学习的宫颈癌诊断 2) 基于机器学习的心血管疾病诊断 3) 基于sklearn的文本分类 | 9 |
6 | 综合实践 项目 | 1) 搜集资料 2) 项目实现 3) 完成一份报告和PPT展示(以小组为单位,2人/组) | 1) 基于卷积神经网络的人脸识别 2) 人群接触网络中的SIR疫情模拟 3) 基于分类算法的肝病诊断 | 12 |