保存成功
订阅成功
保存失败,请重试
提交成功
burning

burning

大数据分析师
目前就职于海康威视, 职位为大数据分析师。...更多
创作文章2

拒绝碎片化教程,一文系统总结 Pandas 的常见用法

网上关于 Pandas 的教程多如牛毛,但质量参差不齐,大多内容零散,缺漏知识点,组织结构混乱。这些教程给我的感觉是,写作者本身很缺乏经验,只是为了赚钱硬上。笔者是一位 4 年+经验的数据分析师,目前在一家海康威视任职大数据分析一职,职业生涯的前三年 Pandas 一直是我手边的重要工具,对于 Pandas 的知识点我有一套更迭了三年的知识体系。不同于常见的 Pandas 教程,本文从功能角度系统总结 Pandas 的常用方法,让人一目了然,同时方便查询。 内容清单如下: 1. DataFrame 缺失值处理(缺失值/非缺失值筛选、缺失值计数、非空值计数、删除缺失值、填充缺失值) 2. DataFrame 重复值处理(判断是否唯一、获取唯一值、获取重复记录、唯一值计数、重复值计数、删除重复值) 3. 条件过滤和成员资格(根据bool值进行条件过滤、用query方法进行过滤、loc+lambda进行过滤、isin成员判断) 4. 值替换 5. 排序(按索引排序、按值排序) 6. 行列处理(插入行、删除行、插入列、删除列) 7. … 适合人群: 1. 数据分析、数据挖掘从业者 2. 想要学习用 Pandas 进行数据分析的人
100 订阅

Plotly 快速入门

Plotly 是一个用于 Python 的交互式、基于浏览器的高级声明式绘图库,它拥有所有 Python 绘图库中最全的 API 和最强大的交互工具,支持科学、统计学、金融、地理、3D 等多个领域多种样式的图表。 plotly.py 建立在 plotly.js 之上,plotly.js 则建立在 d3.js 和 stack.gl 之上,前者被广泛应用于印刷出版物和创建网站。 Cufflinks 是一个 Plotly 的包装器(Wrapper),官方的原话是"a library for easy interactive Pandas charting with Plotly"。Cufflinks 将所有的绘图方法都封装到了 iplot() 方法中(可以类比 Pandas 对象的 plot() 方法)。通过它,我们用仅仅一行代码就能画出简洁、美观(Publication-Quality)、多样(40+)的交互式图表。 plotly.express 是另一个 Plotly 的包装器,它的定位是"rapid data exploration and figure generation" 。Express 支持的图表类型相比 Cufflinks 要少一些,但更加具有针对性。 总结一下,Cufflinks 侧重于数据呈现,Express 侧重于数据探索。 本次分享包含: 1. Plotly 的交互 2. Plotly 画图 3. Cufflinks 绘图 4. Express 画图 5. Plotly 结合 Cufflinks/Express 画图 6. 补充内容(版本、主题、配色、常见问题及解决方案) 文中含大量企业真实使用的作图代码,让你拿来就能用,且对于很多细节都有补充。 适合人群: * 数据分析、数据挖掘从业者 * 想要学习数据可视化的人
Python
85 订阅