Python 实战 Spark

作者/分享人:天澄
向 Ta 提问
高级后端开发工程师,多年互联网研发经验,精通 Python,目前从事 Python 后端开发和大数据相关工作。公众号:「天澄技术杂谈」作者。

Spark 一直是大数据热门的话题,用 Scala 语言编写,且支持多语言,包括 Python、Java、R 语言。对于不了解 Java 和 Scala 的开发者来说,用 Python 使用 Spark 进行大数据分析是福音啊。

本文章涵盖以下内容,且知识点讲解和实例均使用 Python 操作:

  • Hadoop 知识点讲解。
    • HDFS 架构
    • Yarn 运行模式
    • 了解 MapReduce
    • Hadoop 本地集群搭建
  • Spark 知识点讲解
    • 本地编译和搭建 Spark
    • RDD 操作和核心原理
    • Spark 运行模式
    • SparkSQL 讲解
    • SparkStreaming 讲解
  • 日志分析实战
活动取消
已有81人预订
预订达标
文章出炉
     
04月23日
04月30日
退款保证:
• 04月23日前,预订人数未达标,您将获得全额退款。
• 作者未按时完成文章,您将获得全额退款。
你可能还喜欢
JVM 问题诊断快速入门
火币集团研发中心
面试字节跳动的一点小经验
Wayne
互联网公司热门面试题:如何保证缓存与数据库的双写一致性?
魏武归心2016
面试官问:为什么在项目中使用消息队列!到底是想考什么?
零下
如何做好性能压测(二) | 性能压测工具选型对比
阿里巴巴中间件
小程序 · 云开发实战:从 0 到 1 快速开发电商小程序
微信极客WeGeek
10 个最高频的 Java NIO 面试题剖析!
Dolphin
大白话聊聊面试中常被问到的分布式事务
不解释 家狗师
恕我直言,90% 的程序员都扛不住这波 MQ 的面试四连炮!
王码农
手把手教你撸一个代码生成器
JohnDeng
实战:基于 RocketMQ 的电商高并发秒杀场景
RocketMQ
SpringCloud 时代:你的项目结构变了吗?
24KBear
业余赚钱实战
追梦1819
50 道常用面试题让你在求职中脱颖而出
Kings
让 Elasticsearch 飞起来——性能优化实践干货
穿着西装敲代码
微信扫描登录
关注提示×
扫码关注公众号,获得 Chat 最新进展通知!
入群与作者交流×
扫码后回复关键字 入群
Chat·作者交流群
入群码
该二维码永久有效