适用人群:
想了解和学习典型的数据分析流程和实践方法的人
不会使用Python的数据分析师从业者
想转行从事数据分析师行业的朋友
想使用Python实现机器学习的工程师
课程目标:
熟悉数据分析的流程,包括数据采集、处理、可视化等
掌握Python语言作为数据分析工具,从而有能力驾驭不同领域的数据分析实践
快速积累多个业务领域的数据分析项目经验
掌握使用Python实现基于机器学习的数据分析和预测
课程大纲:
一 工作环境准备及Python数据结构讲解
课程介绍、工作环境准备、Python语言基础回顾、Python数据结构讲解
列表、字典、元组、集合、Python高级特性、切片、迭代、Python高阶函数、map、filter、reduce
二 科学计算及数据可视化入门
使用NumPy和SciPy进行科学计算、Matplotlib绘图入门、实战案例:2016美国总统大选数据分析 (2016 Election Polls)
三 本地数据的采集与操作
常用格式的本地数据读写、SQL常用语法讲解、Python的数据库基本操作、数据库多表连接用法详解
left join、right join、inner join
实战案例:欧洲职业足球数据库分析 (European Soccer Database)
四 网络数据的获取与表示
BeautifulSoup解析网页
爬虫框架Scrapy基础
实战案例:获取电商网站的商品信息
五 数据分析工具Pandas 基础
Pandas的数据结构、Series、DataFrame、Pandas的数据操作、数据的导入、导出
数据的过滤筛选、索引及多重索引、Pandas统计计算和描述、Pandas的绘图函数
实战案例:星级争霸II重放分析 (StarCraft II Replay Analysis)
六 数据分析工具Pandas进阶
数据的分组与聚合
数据的分组运算
Pandas透视表和交叉表
实战案例:互联网电影资料库分析 (IMDB 5000 Movie Dataset)
七 数据的规整与可视化
数据清洗、合并、转化和重构
常用的Python数据可视化工具
Matplotlib回顾及扩充
Seaborn绘图
交互式数据可视化—Bokeh绘图
实战案例:空难历史数据分析 (Airplane Crashes Since 1908)
八 机器学习基础及机器学习库scikit-learn入门
机器学习基础
scikit-learn入门
实战案例:利用声音数据进行性别识别 (Gender Recognition by Voice)
九 项目实战:“闪电约会”配对预测
项目介绍 (Speed Dating Experiment)
数据分析与处理
课程总结