序号

实验内容

教学要求

案例/项目

学时

1

爬虫

1) 掌握数据获取的常用方法

2) 掌握数据存储的基本格式

3) 掌握HTTP协议的基本概念

4) 掌握简单Python爬虫的方法

1) COVID-19数据的爬取

2) 新闻数据的爬取

3) 微博数据的爬取

6

2

数据清洗

1) 掌握数据清洗的基本概念

2) 掌握pandas包的使用技巧

1) COVID-19数据的清洗

2) 酒品消耗数据初步探索

6

3

数据 可视化

1) 掌握常用的数据可视化手段

2) 掌握matplotlib包的使用

3) 掌握seaborn包的使用

1) COVID-19数据的可视化

2) 亚马逊雨林数据的可视化

12

4

回归分析

1) 掌握线性回归的基本概念

2) 建立回归模型

3) 回归诊断分析

1) 使用回归构建房价预测系统

2) 使用回归模型预测鲍鱼年龄

9

5

机器学习 算法

1) 掌握机器学习的基本概念

2) 掌握sklearn包的使用

1) 基于机器学习的宫颈癌诊断

2) 基于机器学习的心血管疾病诊断

3) 基于sklearn的文本分类

9

6

综合实践 项目

1) 搜集资料

2) 项目实现

3) 完成一份报告和PPT展示(以小组为单位,2人/组)

1) 基于卷积神经网络的人脸识别

2) 人群接触网络中的SIR疫情模拟

3) 基于分类算法的肝病诊断

12