大数据日志离线日志采集系统分析

作者/分享人:arry
向 Ta 提问
itstar技术委员会主席 itstar全球教学中心首席执行官 平台高级技术总监

某电子商务网站在线团购业务:每日 PV 数100万、独立 IP 数5万,用户通常在工作日的上午10:00-12:00和下午15:00-18:00访问量最大。日间主要是通过 PC 端浏览器访问,休息日及夜间通过移动设备访问较多。网站搜索浏览量占整个网站的80%,PC 用户不足1%的用户会消费,移动用户5%会消费。

通过简单的描述可以粗略的看出,这家电商网站的经营状况,可以看到愿意消费的用户从哪里来、有哪些潜在的用户可以挖掘、网站是否存在倒闭风险等。

主要内容:

  • SEO 网站日志功能介绍
  • 网站服务器日志数据分析
  • 网站 Apache 服务器数据获取对接
  • 网站数据仓库搭建、数据模型设计
  • 服务器日志数据仓设计、可视化借口对接
  • 可视化使用,优化、仪表盘使用

涉及到的技术:Hadoop、Spark、Hive、HDFS、ELK Stack、Flume、Kafka。

已有91人预订
预订达标
文章出炉
     
01月08日
01月24日
预订后,您将在01月24日之前获得一篇专享文章,您还将获得一张arry的读者圈Pass
请务必添加GitChat服务号以查看活动进度及获取活动通知。
退款保证:
• 01月15日前,预订人数未达标,您将获得全额退款。
• 作者未按时完成文章,您将获得全额退款。
你可能还喜欢
聊聊 CSS 中的布局模式
大漠_w3cplus.com
Spring Boot 2.0 的快速入门(图文教程)
泥瓦匠 @ bysocket.com
浅谈如何开一场 Chat
白宦成
如何在网上下载自己需要的资源
曹某某
GitChat 被恶意攻击引发的技术性思考:拒绝服务攻击
肖志华
利用开源代码和读相关论文来提高写代码能力
李峰
前端如何拥有自己的服务器
郭方超
如何更好的把控项目进度以及对资源进行估算
PM圈子-管理
前端跨域问题各种解决方案
npc光明
工作之余如何高效学习
安晓辉
分布式熔断、限流与服务保护:深入 Hystrix 原理及使用
快乐崇拜
如何基于 Vue 2 写一套 UI 库
mon
通过源码深入理解 Spring 事务的实现原理
一只前端狗的年终总结
芋头
查询参数缓存从零到一个框架的演进
奔跑吧架构师
微信扫描登录