首本 Druid 技术书作者介绍最火实时大数据 OLAP 技术原理和实践

作者/分享人:刘麒贇
第一本Druid技术书《Druid实时大数据分析原理与实践》的作者,在Druid技术的原理和实践方面都有着很深的沉淀。现任Testin云测公司技术总监,全面负责领导团队完成数据分析产品的研发。作为资深数据技术专家,曾为多个著名开源项目(Hadoop/Sqoop/Oozie/Druid)贡献源代码,在互联网大数据分析、机器学习和统计学应用等方面拥有丰富的实战经验和相关专利,并拥有丰富的大型技术演讲经验。

实时大数据OLAP技术一直是大数据几座最陡峭和难以征服的技术高峰之一,因为在海量数据、实时性、复杂的OLAP技术和系统复杂性之间达到平衡本身就是一件很困难的事情。为了解决这个难题,各大互联网和技术公司都各自出了不同的解决方案,但都会存在这样或那样的问题,因此一直都没有公认或事实上的技术方案。不过,当Druid项目横空出世后,这一切都得到了改变:它近乎完美地解决了以上所有的技术矛盾点,从而它迅速在技术和工业圈传播开来。然而,由于Druid技术比较新,资料比较少,因此很多用户遇到了很多学习的困难。

在本场Chat中,第一本Druid技术书《Druid实时大数据分析原理与实践》的作者将会深入浅出地介绍Druid技术原理、他在大规模Druid集群的实际使用经验和技巧,想必一定能够帮助大家彻底掌握住实时大数据OLAP技术的精髓。

实录提要:

  • Druid 和 Spark Stream 、Clickhouse 的区别?
  • 有实例介绍如何读入数据、如何处理吗?
  • Druid 如何使用 bitmap?
  • Druid 是否有推荐的图形化方式?
  • Druid 目前支持的操作还是比较少的,数据保存后,是否能重新被其他工具利用?
  • 实际生产中,适合和哪些其他工具组合?
  • Druid 有资源隔离吗,不同查询之间会不会相互影响,有哪些坑?
  • 不同查询量级,肯定对资源消耗不同,如何保证每个查询都能在秒级返回结果?
  • 介绍下 Hadoop、Spark 和这个开源平台最适合使用的场景吗?
已有226人预订
预订达标
文章出炉
交流日期
     
17.04.13
17.04.27
17.05.04 20:30
查看文章评论/提问
有奶喝先森
刚开始接触Druid,期待晚上的chat。
panbc
干货很多,清楚了很多原理!!
bugall
我们是做广告的公司,有个冷数据多纬度olap的需求,我现在暂定是用kylin的方案,但是有一点比较担心的就是预设纬度,druid在做olap的时候需要预设纬度么?
张海雷: 也是要预设的,因为会在维度上创建index
open
最近开始关注druid技术,感谢分享,收获很多!
徐飞
Druid好处最方便完整体系。但是貌似和hadoop不成体系,另外看到kylin 和 carbonData看到国人在这方面走的也挺靠前。
Edwin
能说说和Spark Stream的区别吗?
徐飞: spark streaming是准实时计算,这个框架是一个完整的OLAP方案,实时计算也是它里面的一块内容。比如kylin就用sparkstreaming作为他们实时报表的计算引擎。
Giant
干货很多感谢分享
Jhq
希望有实例介绍,如何读入数据,如何处理等。
Jhq
如何使用bitmap?
王瑞平 、
Druid是否有什么推荐的图形化方式?
Jhq
Druid目前支持的操作还是比较少的吧,数据保存后,是否能重新被其他工具利用?比如用于hbase等等
Jhq
实际生产中,适合和哪些其他工具组合?
Giant
druid有资源隔离吗,不同查询之间会不会相互影响,有哪些坑?
本人新手,想了解一下druid和hadoop有没有什么关系
鲍科
能介绍一下和clickhouse的区别吗
贺贺
不同查询量级,肯定对资源消耗不同,如何保证每个查询都能在秒级返回结果,是否可以对不同的查询的计算资源进行限制
Adele
可以分别介绍下Hadoop,Spark和这个开源平台的最适合使用场景吗?
Adele
以及背后的团队,是否有团队一直支持
新城旧事
Druid对于SQL的支持怎么样呢
你可能还喜欢
Docker+K8S 集群环境搭建及分布式应用部署
李熠lynn
JVM 精华知识点汇总
胡玉洋
Docker 入门之个人博客搭建教程
一念成魔
前端游戏框架哪个好
cba
MySQL 数据同步双机互备
小闲丶
美团客户端响应式框架 EasyReact 开源
美团技术团队
微信扫描登录