保存成功
订阅成功
保存失败,请重试
提交成功

流式计算模型 Structured Streaming:快速入门开发

¥6会员免费看
Kane
5
严选 Chat了解严选标准

从 Spark2.0 开始,Spark 引入了一套新的流式计算模型:Structured Streaming。该模型在未来很可能会替代调掉 Spark Streaming 成为实时计算的主流。那么 Structured Streaming 到底有什么优势,在设计以及思想上为何比目前主流的 Spark Streaming 更受官方推崇,本 Chat 将为您逐一解答,而且不光有从入门级的开始,更有理论和代码演示,让读者快速了解 Structured Streaming 并上手开发。

在本场 Chat 中,会讲到如下内容:

  • Structured Streaming 概述及快速入门
  • Structured Streaming 输入表、结果表、输出等基本概念
  • Structured Streaming 处理事件及容错语义
  • 创建 Streaming DataFrame/DataSet 的几种方式
  • 基本 API 操作
  • 基于 event-time 的窗口操作
  • 基于 watermark 处理延迟数据
  • 流数据去重
  • Stream-static joins 和 Stream-stream joins
  • 输出模式(Append/Complete/Update)
  • 输出接收器(file/kafka/console/memory等)
  • Trigger 触发器--连续处理模式
  • Structured Streaming 项目实战(广告黑名单实时统计/广告点击量实时统计)

适合人群: 对 Structured Streaming 有兴趣的技术人员

176 人已订阅
会员免费看
¥6 原价订阅
关注提示×
扫码关注公众号,获得 Chat 最新进展通知!
入群与作者交流×
扫码后回复关键字 入群
Chat·作者交流群
入群码
该二维码永久有效
严选标准
知道了
Chat 状态详情
开始预订
预订结果公布19.11.25

预订达标,作者开始写作

审核未达标,本场 Chat 终止

作者文章审核结果公布19.12.11

审核达标,文章发布

审核未达标,本场 Chat 终止

Chat 完结
×
已购列表