保存成功
保存失败,请重试
提交成功

PySpark 机器学习实战

作者/分享人:涤生
算法工程师,主要从事广告相关的算法工作,欢迎关注公众号“机器学习与深度学习剑指offer”(微信号:AI_Offer),发布机器学习面试题及解答,以及一些面经。

Apache Spark 作为目前应用最为广泛的分布式计算框架,能帮助开发者快速处理大数据的查询和计算问题。为了支持 Python 适用 Spark,Apache Spark 社区开发了 PySpark 工具。实际工作中,通常面临对大批量数据进行处理等过程,所以算法工程师很有必要掌握 PySpark 这个工具。本次 Chat 旨在全面系统地介绍 PySpark 的数据处理过程,以及结合实际数据,介绍如何利用 PySpark 训练及调用机器学习模型。

在本场 Chat,会讲到如下内容:

  • Spark 的核心概念介绍,RDD 和 DataFrame 的使用
  • PySpark 在统计分析,回归,分类,聚类的实战案例
  • PySpark文本挖掘,推荐系统中的应用

适合人群:数据科学的从业人员,以及有一定python编程基础的在校学生

会员免费订阅
已有64人预订
预订达标
文章出炉
     
12月08日
12月22日
预订后,您将在12月22日之前获得一篇专享文章
请务必添加GitChat服务号以查看活动进度及获取活动通知。
退款保证:
• 12月08日前,预订人数未达标,您将获得全额退款。
• 作者未按时完成文章,您将获得全额退款。
你可能还喜欢
如何判断一家公司是否靠谱
张亮
程序员的数学修养
李烨
三年 Vue 前端开发的血与泪总结
程序员骚俊
Linux 系统必知必会
Peter
实战解决高并发数据入库 Redis 队列缓存+MySQL 批量入库(Spring Boot)
微服务实战生产
调用链监控:微服务时代每个程序员必须点亮的技能点
编码
一篇文章吃透设计模式 7 大原则
luke
一篇 Chat 带你快速学会 Java 项目管理工具:Maven
Color
分布式系统搭建实战(上)
潇潇雨幕
Spring Cloud Alibaba 微服务实战
菠萝炒辣条
精通 MyBatis 系列之应用分析和最佳实践
TopJavaer
MongoDB 数据同步到 Elasticsearch 实战分享
大河
MacOS 终端 iTerm2 内功心法
古拉里
Go 语言从零基础到开发 API 接口
laixhe
Java Bean 映射转换方案及性能对比
菠萝炒辣条
微信扫描登录
关注提示×
扫码关注公众号,获得 Chat 最新进展通知!
入群与作者交流×
扫码后回复关键字 入群
Chat·作者交流群
入群码
该二维码永久有效