目前大数据备受瞩目,国家划分了数据科学与工程的学科,大数据的快速发展成为历史必然。然而对于很多包括我在内的学习者,都会出现无从下手的情况,到底是应该先学习语言还是理论?哪一种语言更加普适?学习了之后又该如何进行验证和尝试呢?许多学习者往往就卡在了学习的第一步。
一、大数据的起源与发展
“大数据”这一概念最早公开出现于1998年,美国高性能计算公司SGI的首席科学家约翰·马西(John Mashey)在一个国际会议报告中指出:随着数据量的快速增长,必将出现数据难理解、难获取、难处理和难组织等四个难题,并用“Big Data(大数据)”来描述这一挑战,在计算领域引发思考。此后大数据技术不断发展,于2012、2013年达到其宣传高潮,2014年后概念体系逐渐成形,对其认知亦趋于理性。
现如今,大数据已成为信息化时代发展不可或缺的一环,引发了商业领域的重大变革。
二、为什么要学习大数据
首先,大数据的应用领域广、就业选择多。信息化时代,各个行业都需要大数据的支持,任何一个公司、品牌想要成功,都需要分析用户的行为、喜好,而这些都离不开大数据。所以,大数据行业的应用领域是非常广的,大数据行业人才在就业市场上也非常受欢迎。
其次,大数据行业的发展速度非常快。大数据作为国家重点扶植发展的高薪技术,发展速度超乎想象。在未来,随着计算机技术的不断发展,大数据行业也将继续发展,大数据行业人才的地位将不断提高,在就业市场上也会越来越受欢迎。
最后,也是最直观的一点,大数据能够带来高薪。根据拉勾网上的数据显示,许多大厂都在招聘大数据相关岗位,并且薪资可观,最多的甚至开到了25k/月。所以,入行大数据领域,也成为了许多想拿高薪的人的最佳选择。
图源:拉勾网大数据岗位
三、学好大数据的关键
1.端正的态度,足够的好奇心
学习任何一门新的技术都需要良好的态度和足够的好奇心,这样才能应对可能发生的种种挫折和挑战。
千万不要认为学习大数据很容易,而是要在开始就端正好态度,将学习大数据当作一件需要努力的事,并积极思考、积极地解决遇到的各种问题,才能够将大数据学好。
2.良好的基础
编程语言基础:Java语言是大数据学习的基石,良好的语言基础是成功的一半。Java语言学习部分可以阅读《Java核心技术》这本书,共分1、2两卷,卷1是基础,卷2是深入学习,讲解由浅入深,代码结构良好,能够把卷1的代码弄懂、跟着打一遍,就能很好地掌握Java基础了。
数据结构与算法:这里推荐《算法图解》这本书,用画图的方式,用可视化的方式形象地讲解算法,可以说是给小学生入门都足够了。
数学理论基础:大数据学习自然缺少不了坚实的数学基础,虽然不需要像数学专业的学生那样精通数学,但也要掌握相关的基础知识,如高等数学、线性代数、概率论与数理统计。这里推荐《程序员的数学》这本书,能够在没有晦涩公式的情况下,快速掌握编程需要的数学思维。
2.注重实践
打好基础后,实践在大数据学习中是非常重要的一门课。从学习角度讲,实践能够帮助我们更好地理解学习到的原理,从而更好地掌握技术;从求职角度上来讲,实践经历丰富的求职者更受企业的青睐。
那么如何获得实践经历呢?最简单的方法自然是找实习,但大公司的实习门槛也非常之高,小公司的实习又可能只是“干苦力”,没有任何实质收获。要想用最短的时间、最少的成本获得实践经历、项目经历,最好的方法就是进行课程学习。
当然,我们可以从网络平台上去找各种各样的学习资源,但是网络上资源太过于繁杂,并不利于我们学习整合。包括在Github网站上也有一些不错的开源项目实践,但国内Github连接并不稳定,大多数时间我们无法进入;即使我们进入了这个网站,从上面下载了开源项目源码,但很多项目并没有详细的环境配置介绍,这导致我们很可能无法配置正常环境,程序无法正常运行;同时,这个网站对我们的英语也有一定程度的考验。
因此,这里我推荐“头歌”实践教学平台(也是我本人实践的时候经常使用的平台),作为一个实践型的MOOC,平台上有各种类型的实践课程,由来自各大名校的老师讲解,学习课程的同时还能动手实践项目,既能学习基础知识,又能获得实践,对学习和工作都有帮助,可谓一举两得。
以这门《大数据分析与处理》为例,课程包含数据采集、MapReduce编程模型、Hive 操作数据、Spark数据分析与处理等内容,同时包含30个实训项目,在实践中掌握知识,又增加了项目经历,低成本高效率地入门大数据,向高薪迈进。
头歌平台包含多门课程以及实战训练,所有入门级程序员都知道配置环境是一件多么没有意义且令人头疼的事情,并且使用不同主机可能对程序的表现有不同的限制,然而使用头歌平台的在线评测,可以越过环境配置和本地主机限制,直奔主题进入实战演练,从而大量节省了学习者花在无意义事情上的时间。