转行自述】

坐标深圳,双非一本院校毕业,毕业两年,非计算机专业。

今年想转行做大数据分析,了解了几家线下培训机构,价格基本上在1.8w-2w之间,涉及的技术栈也不多,感觉性价比都不是很高,决定还是自学。

先说下结果吧,脱产自学1个多月(培训班一般也是1个多月的时间),主要学习Oacle、Mysql、Hive、Python、Linux,基本上掌握这些的话应聘大数据分析岗位是没有问题的,最后也是如愿拿到某大厂外包13k,对于小白来说这个薪资还算可以接受。接下来就说一下这一个多月的学习安排。

第一周

【资料收集、环境搭建、学习Mysql】

首先是资料收集,尚硅谷官网就有很多免费视频和资料可以找到,例如Hive的资料我用的就是尚硅谷的。不过尚硅谷的资料偏理论的比较多,针对性不是很强,很多面试问的问题都没有涉及,所以只看尚硅谷的资料是不足以应对面试的。

幸运的是,身边刚好有个行业内的朋友,之前是培训班出来的,于是拿到了一套培训资料,还有很多笔试题目。有了以上这些资料,基本一个月的学习都够用了。

经验数据是什么意思_大数据优质经验_经验和数据哪个重要

学习资料整理

然后是环境搭建,要安装的软件有很多,Mysql、Oracle、Ptyhon、Kettle、FInereport等,这些都是大数据工程师必备的一些软件,安装会比一般的软件复杂很多,网上都有教程可以看。另外,如果电脑性能支持的话,也可以安装个虚拟机,这样就可以在电脑上用Linux和Hive了。

把这些搞完,这周就基本剩下一半时间了,然后就可以开始学习Mysql了。Mysql推荐到菜鸟教程上边学习,里边的东西很基础,很适合小白入门。如果对Mysql需求不是很大的话,建议只需要学它的基本语法就好了。

第二周

【学习oracle、学习大数据理论基础】

首先是Oracle的学习,我用的是培训的资料(很多培训班主要教的也是这个)。如果前面Mysql学习得比较扎实的话,那么Oracle的基础语法可以学得很快,两者差别也不大。

重点是存储过程的学习,有些数据分析、报表开发的面试岗位,是要求能够直接上手存储过程开发工作的,因此这一块要重点准备下,要能够独立进行完整的存储过程的编写。另外,(敲重点!),子查询、分析函数也是重点学习对象,很多岗位面试要求笔试的,如果子查询和分析函数不熟练的话,笔试题会做得很痛苦。

至于大数据理论基础这一块,主要以看视频为主,B站有很多不错的资源,推荐尚硅谷的Hadoop3,至少需要把Hadoop、HDFS、Yarn、MapReduce、Hive这些东西搞清楚,另外也推荐尚硅谷的数仓课程,了解数仓分层、数据仓库建模、维度表、事实表。

第三周

【刷笔试题,学习Hive】

学习完SQL之后,就可以尽快用笔试题来试试水了,对于初学者,刚接触笔试题可能会一下子有点懵逼,这时候可以先把前面的Oracle复习一下(重点还是子查询和分析函数),复习完之后再刷个3、4套笔试题就差不多了。

之后最重点的来了——学习Hive。Hive是离线数仓的必备工具,算是大数据的入门门槛吧(等有一定工作经验以后可以转做实时数仓,但不建议一开始转行就直接找实时的)。

关于Hive的学习,我是用尚硅谷的资料,学习基础语法时要注意总结HiveSQL与Oracle、Mysql语法的差异(包括用的很多函数也是不一样的)。另外,Hive优化这一块要好好准备一下,这是面试高频问题,很多数据分析的岗位是要求有一定Hive调优经验的,包括数据倾斜,SQL语句优化等。

第四周

【学习Python、Linux】

关于Python的学习,之前有买过一套风变编程的基础语法课程,一直没有看过,现在终于派上用场了。这个课程一共有16章,学习11-13章就够用了,大概需要2-3天的时间。如果没有买课程也没关系,看B站的视频也是完全够用的。

除了基础语法以外,还是得了解一些Python具体的一些应用,熟悉常用的模块(例如日志模块),以及实际使用的场景。在数据分析的工作中,Python的应用还是很广泛的,例如数据文件解析、数据入库、切片等等,都可以用Python来实现。

至于Linux这一块,因为一般工作中用的主机,操作系统都是Linux,所以至少得熟悉一些基本命令,比如cd、pwd、ll、ls、cat、touch、vim、mkdir等等,这些知识在网上都可以很容易搜索到,另外,也要掌握通过sed、grep、awk等命令编写shell脚本。

第五周

【制作简历,准备面试,学习kettle、finereport】

到了第五周,如果前面学习得比较顺利的话,那么恭喜你,你已经可以开始准备简历啦~简历是一块非常重要的敲门砖,除了学历、工作年限这些“客观”因素以外,重点还是在于技术栈和项目经验的体现。

如果你的简历匹配度比较高的话,直接挂在招聘网站上,就会有很多HR主动找你了(大多数是外包),一般在2-3天左右就能收到面试邀请了。在正式面试之前,建议先进行一场模拟面试,我当时是找一个业内的朋友给我模拟面的。后边会专门出一期关于简历制作和面试准备的分享贴,因为涉及的东西太多了,这里就不展开赘述了。

另外,在找工作的间隙,除了巩固前面学的知识以外,也可以根据自己的意向岗位,有针对性得学习一些常用软件。

例如你的意向岗位是ETL工程师,那么你应聘的岗位很可能需要用到kettle,可以看b站上面黑马程序员的kettle视频,但是讲得比较详细,也有相关的课件资料,缺点就是主播的普通话不太标准。尚硅谷的视频也值得看一下,有案例演示。如果只是入门的话,Kettle的学习大概只需要2天就够了;

如果你的意向岗位是报表工程师,那么你至少需要掌握一个报表开发软件,例如Finereport,这个相对来说会比较容易上手(官网就能下载),而且官方文档的解释非常详细,学习1天就能入门了。

【结尾】

大概过了一个星期(面了3-4家公司),我终于收到了offer。本人比较懒,就没有继续面了(而且薪资和待遇也还可以接受)。

回顾这一个半月的转行经历,觉得自己还是蛮幸运的,在朋友的帮助下坚持了下来,省了1万多的培训费,而且后边跟朋友聊的时候才知道,有的培训班还挺坑的,主要是给学员包装简历,实际上要学的东西还是得靠自己。

最后,希望这篇文章可以给想要入行大数据的朋友一些帮助, 原创不易,转发前请咨询本人同意,谢谢。


本文由转载于互联网,如有侵权请联系删除!