数据分析基础:Pandas “骚操作”基础教学

作者/分享人:刘明
向 Ta 提问
机器学习算法工程师

这是一个 Pandas 快速破冰课程,主要教学对象是数据分析新手以及对 Pandas 掌握不够全面的人。

几乎所有数据分析/挖掘工程师,都需要掌握 Pandas。数据分析的过程中,第一个面临的问题就是数据处理。而 Pandas,是 Python 数据处理的唯一选择。不掌握 Pandas,就无法着手进行数据分析项目。

虽然本场 Chat 从最基础的讲起,但目的绝不仅仅是入门!学习本课程过后,读者足以使用 Pandas,进行实际项目。

通过课程,你将掌握:

  • Series;
  • DataFrame;
  • 分级/重建索引;
  • 条件查找;
  • 行/列处理;
  • 统计/分组统计;
  • 数据行(列)合并;
  • 数据补全;
  • 基于条件/过滤器的批量操作;
  • 自定义函数;
  • IO 处理;
  • 数据可视化。

当你掌握了以上内容,会发现,原来 Pandas,完全可以代替数据库,而且使用数组操作的 Pandas,比用 SQL 语言简单太多了。

课程结束时,你已经完全可以使用 Pandas 进行各种“骚操作”了。完成数据处理,特征工程不在话下!

现在,正式开始我们的数据分析之旅吧~

已有158人预订
预订达标
文章出炉
     
04月24日
05月08日
本场 Chat 文章已出炉,购买后即可阅读文章并获得一张刘明的读者圈Pass
请务必添加GitChat服务号以查看活动进度及获取活动通知。
查看文章评论/提问
张昆
样例代码感觉不完整吧!
刘明: 所有例子都是完整的
未世: df['Name'].value_counts() 这行应该是print出来,虽然无伤大雅
lucioluo
文章中那两个Series类型相加的结果错了吧
刘明: 所有代码我都重新运行了一遍,并未发现错误,可以具体说一下哪条语句吗
你可能还喜欢
如何设计一个灵活的 MySQL 数据表,应对灵活多变的需求
李岩
Jenkins 自动化构建部署实战
火币集团研发中心
Java 程序员应掌握的 Nginx 实战应用
JPM
带你玩转 JSON
能量架构师
Python Pandas 做数据分析之玩转 Excel 报表分析
WinterLeo
小程序从入门到进阶
loonglong
微信扫描登录