保存成功
订阅成功
保存失败,请重试
提交成功
Tumweeg

Tumweeg

资深数据玩家
目前于某一线大厂lab从事数据相关技术工作。熟悉大数据平台研发,架构,以及数据的处理和分析,熟悉web架构和高性能/高并发/高可用系统,CSDN博客专家,研究兴趣在大数据(分布式系统),数据库内核,机器学习等,欢迎技术交流,共同提高,微信公众号:就爱极客(cn92geek).微信号wotchin,微博wotchin(频繁更新),朋友圈定期分享欢迎添加...更多
创作文章2

大规模数据处理系统的最新技术与应用

自从上世纪 60 年代开始,人们便发现数据与代码分离的重要,由此在 70 年代催生出关系数据库。传统关系数据库(RDBMS)发展至今,面对海量数据处理的 AP 场景时,显得捉襟见肘。由此又诞生了以 Hadoop/Spark 等为首的分布式数据存储或计算引擎,NoSQL 的概念也被提出。 人们对 NoSQL 在不同阶段具有不同的认知。从 not SQL 到 not only SQL 再到如今的 No, SQL!Hadoop 生态的传统大数据解决方案面临来自 NewSQL 的挑战。 本次 Chat 中我将主要分享最近几年学术/工程界对数据库/大数据/分布式系统研究与实践的最新成果,希望给大家带来对数据宏观上的理解与架构思想上新认知。
数据处理
183 订阅

中小型企业基于大数据技术的项目实践

本次分享将涉及大数据项目的具体实践经验,象征性收费5毛钱。 本次 Chat 主要包括但不限于以下内容:Spark 对日志的分析与处理,基于机器学习的数据分析、任务调度系统、推荐系统等,不要求读者有任何基础,但凡有交流的兴趣即可。 本次分享将讲解到的知识体系包括: - Apache Spark 框架编程,主要涉及 Spark Streaming + MLlib 部分内容 - MongoDB,主要涉及 MongoSpark、地理位置搜索等功能 - 基于 Azkaban 的任务调度系统 - Linux 系统的部署与运维 - Amazon AWS 数据存储平台 分享后主要交流的内容:大数据平台架构、机器学习相关内容、微服务架构等。
大数据
916 订阅