极客书
白话大数据与机器学习
高扬 & 卫峥 & 尹会生
2311
已阅读
18
万字

内容简介

本书以降低学习曲线和阅读难度为宗旨,重点讲解了统计学、数据挖掘算法、实际应用案例、数据价值与变现,以及高级拓展技能,清晰勾勒出大数据技术路线与产业蓝图。

目前很多大中型企业都有数据分析岗位,尤其是和自己业务结合紧密的分析岗位。企业求贤若渴,而求职者对数据分析岗位望而却步。原因有三:

  • 数学基础薄弱
  • 学习成本高
  • 变现不确定

本书通俗易懂,有高中数学基础即可看懂,同时结合大量案例与漫画,将高度抽象的数学、算法与应用,与现实生活中的案例和事件一一做了关联,将源自生活的抽象还原出来,帮助读者理解后,又带领大家将这些抽象的规律与算法应用于实践,贴合读者需求。同时,本书不是割裂讲解大数据与机器学习的算法和应用,还讲解了其生态环境与关联内容,让读者更全面地知晓渊源与未来,是系统学习大数据与机器学习的不二之选。

作者简介

高扬,金山软件西山居资深大数据架构师与大数据专家,有多年编程经验(多年日本和澳洲工作经验)和多年大数据架构设计与数据分析、处理经验,目前负责西山居的大数据产品市场战略与产品战略。

卫峥,西山居软件架构师,多年的软件开发和架构经验,精通 C/C++、Python、Golang、JavaScript 等多门编程语言,近几年专注于数据处理、机器学算法的研究、应用与服务研发。曾在新浪网平台架构部负责音视频转码平台的架构和研发工作,为新浪微博,新浪微盘,秒拍等提供视频在线观看服务。51CTO讲师。

尹会生,西山居高级系统工程师。曾任新浪研发中心技术经理、北京尚观科技高级讲师。在新浪广告、微博广告、西山居大数据平台架构中担任关键角色。

万娟,星盘科技有限公司 UI 设计师平面,对 VI 设计、包装、海报设计等、商业插画、App 交互、网页设计等有独到认识。

本书内容
前言
第1章 大数据产业
第2章 步入数据之门
第3章 排列组合与古典概型
第4章 统计与分布
第5章 指标
第6章 信息论
第7章 多维向量空间
第8章 回归
第9章 聚类
第10章 分类
第10章 分类(上)
第10章 分类(下)
第11章 关联分析
第12章 用户画像
第13章 推荐算法
第14章 文本挖掘
第15章 人工神经网络
第16章 大数据框架简介
第17章 系统架构和调优
第18章 数据解读与数据的价值
附录 A VMware Workstation 的安装
附录 B CentOS 虚拟机的安装方法
附录 C Python 语言简介
附录 D Scikit-learn 库简介
附录 E FANN for Python 安装
附录 F 群众眼中的大数据
写作花絮
参考文献

极客书购买须知

  1. 本产品为《白话大数据与机器学习》一书电子版全本内容,共计 18 万字。
  2. 付费购买用户、会员用户可享受文章永久阅读权限。
  3. 本产品为虚拟产品,一经付费概不退款,敬请谅解。
  4. 本产品内容授权自北京华章图文信息有限公司。
  5. 本产品每周一、三、五更新,全部内容在 2018 年 5 月 18 日 前更新完毕。
  6. 极客书同时可在 http://gitbook.cn/ 购买与阅读。
推荐极客书
更多极客书
微信扫描登录