三个月大数据研发学习计划

作者/分享人:Fickr孫啟誠
向 Ta 提问
现为区块链技术研究员,曾为互金公司大数据研发工程师。

本场 Chat 是我个人用 3 个月业余时间从一名 Java 后端工程师转型为大数据研发的经历分享。我将在文中为普通程序猿制定一个详细的学习计划,目的在于用 3 个月的时间蜕变成为一名大数据研发人员,并胜任一份大数据研发的工作。主要内容包括:

  1. 大数据行业概述
  2. 大数据工程师技能要点
  3. 3 个月详细的学习计划
  4. 学习资料推荐与分享
  5. 大数据项目案例分析
  6. 后续持续学习资源推荐
  7. 持续答疑

实录提要:

  • 若入行大数据,那入行的技术水平大概是怎样的?
  • 如何做到保证三个月的时间里,学习进度跟上计划,不被琐事打扰的?
  • 三个月的学习中,遇到的最大困难是什么?
  • 在学习完上述知识点之后如何找到一份大数据的工作?
  • 在学习过程中,遇到了某些束手无策的难题时,有哪些途径解决?
  • 在工作实践中,对于 Java 虚拟机的应用多吗?
  • 目前大数据工程师、大数据分析师,在实际工作中算法的应用是不是占比很大?
  • 除了大数据方面的技术,J2EE 方面或者 Java 方面还需要什么技术要求吗?
  • 关于 JVM,需要了解到什么程度,能举一个具体点的例子吗?
已有768人预订
预订达标
文章出炉
交流日期
     
17.09.30
17.10.13
17.10.18 20:30
查看文章评论/提问
故事自己写
感谢分享。
Fickr孫啟誠: 对大家有帮助就好,由于只是个人经验,不一定有普适性,可以依据自身的情况做一些调整。
缄默
已记录到计划本上,3个月的大数据学习挑战!
Fickr孫啟誠: 加油!学习过程中有任何问题,可以到读者圈提问,或者加我微信。每个问题都会认真回复。
跳跳熊
连接失效,能重新补一个否?
   
百度网盘的链接挂了, 能不能补一个? 谢谢
夏春涛
充满实战,赞
Fickr孫啟誠: 实战包括两块: 01.集群搭建的部分(这部份主要是写给大数据运维方向的)。 02.最后面两个案例分析(一个批处理,一个实时处理主要针对大数据开发人员)。
Eric
感觉写的有点泛啊 请问一下 学到什么程度才算ok呢 比如linux 过一遍20小时可能够 全部掌握怎么也不够吧...
Fickr孫啟誠: 对于每一块,我都列出了全部需要掌握的知识点。 大数据相关的工作,要求工作人员的知识面很宽,需要什么都知道,什么都会。 对于每一个技能,都是分了解,掌握,精通三个阶段的。 每个知识点都精通自然最好,但是人的精力有限,要明确对于每一个知识点你现在处于哪个阶段,通过上面的学习尽量提升到下一个阶段就ok了。 学无止境我所列举的知识点,大家3个月学完应该对每个知识点都处于全部都了解,然后大部分都掌握(集群搭建,Hadoop,Hive ,spark ),这样胜任一份初级的工作基本没有问题了,然后工作中用到你了解但是没有掌握的部分,你用Google 搜索一下,案例基本可以解决公司的需求。然后在这种不断地实践中掌握更多。 再强调一次,快速学习能力真的很重要,实际工作中可能有千奇百怪的需求,需要你短期内,去学习陌生的知识,并解决实际问题。
starmorning
手上并没有I7,64位,16G的服务器用于demo实践,作者有没有靠谱性价比高的云服务器推荐?
Fickr孫啟誠: 其实,自己写demo,对性能要求不是太高,机器配资标准降低一点也可以。 阿里云,我只用它来建过网站。(百度云,腾讯云没有使用过) Ucloud,我个人觉得还可以,推荐使用。 我上面介绍集群搭建的方法是一个一个组件自己安装,目的是为了在学习的时候,对每个组件有更深入的了解,因为会有很多配置文件要修改,这样可以让你了解到很多深层的东西。 实战中有可能为了简便,直接使用CDH版本的(Cloudera's Distribution Including Apache Hadoop ),有图形化界面,直接点击就可以搭建集群(当然要以牺牲一部分性能为代价)。
李志双
赞,感觉又有了人生方向啊
Fickr孫啟誠: 谢谢你的肯定!
Ears
... 我9块钱啊
爽了个爽
对虚拟机的要求有多高?平时开始发java所占比例是多少呢?
高永涛
大赞,写的这么详细,已经在奔往大数据的路上,加油
yonguo
非常详细,感谢分享
你可能还喜欢
如何成为一名合格的 C/C++ 开发者?
范蠡
从新一期技术雷达看技术领域最新趋势
徐昊
微服务中的短信服务如何设计?
猿天地
亿级 QQ 会员活动运营系统的设计之道
廖声茂
详解 Java 常用的四种锁机制优缺点
安爷
数据科学 Kaggle 比赛项目实战:Titanic
刘明
微信扫描登录