继续介绍大数据系列岗位的要求,今天是“最热门”岗位数据挖掘,数据挖掘岗位的真正兴起是随着互联网的发展起来的,主要是因为互联网行业数据包含的价值较大、数据类型较多(包括结构化数据、文本数据、语音、图片等)、价值密度低等特点造就的。还是先从几个大厂的岗位要求说起。
浙江执御
1、本科或硕士以上学历,具备扎实的数学和计算机科学功底,以及坚实的数据挖掘和机器学习理论基础;
2、2年以上用户行为分析及挖掘相关实战经验,熟悉但不限于分类/聚类,个性化标签,属性挖掘等领域;
3、熟悉Linux开发环境,具有良好的编程基础,掌握C/C++/Java/Python等至少一门高级编程语言,会用SPSS、R等数据挖掘工具;
5、良好的沟通能力、逻辑思维能力以及学习能力;
蚂蚁金服
1、计算机、数学、统计或相关专业本科及以上学历,三年以上工作经验,具备良好的沟通能力;
2、熟悉数据分析、数据挖掘算法模型,并有独立完整的建模实践经验,较强的编码/调试诊断能力,扎实的数据结构和算法功底;
3、熟悉实时和离线大数据处理经验,有hadoop MR开发经验,熟悉Hive,Spark,Storm,Kafka等大数据处理框架是加分项;
华为
1、 数学、统计学、计算机以及运筹学等相关专业本科或以上学历,5年以上工作经历;
2、 熟练使用数据库查询语言如SQL、MySQL等;
3、 熟悉R、SAS、SPSS等至少一种相关分析软件;
4、 掌握Python、Java等一种或以上编程语言;
5、 掌握数理统计和数据分析,掌握回归分析、分类、聚类、关联规则等常用数据统计模型和挖掘技术,并有独立完整的建模实践经验;
6、 逻辑思维严密,有很好的分析能力和报告展示能力,具备业务抽象、分解和标准化的能力;
7、 良好的语言沟通和表达能力,较强的自我驱动能力。
网易重点学校硕士及以上学历毕业,3年以上工作经验,有大型互联网公司从业经验优先;具备良好的编程能力和代码风格,熟练掌握Java、Python、Scala等一门强类型语言,并至少掌握一门脚本语言;熟悉机器学习常用算法,有文本挖掘、自然语言处理方面经验者优先;具有良好的分析问题和解决问题的能力,对解决具有挑战性问题充满激情,有较强的学习能力,并且能够快速实现数学模型;熟悉Hadoop/Spark分布式大数据处理系统者优先小影计算机相关专业本科以上学历,两年以上数据开发挖掘经验对数据挖掘整个流程有所了解,对常用算法原理有深入理解,并且有实际使用经验有实际的数据挖掘项目经验,包括但不限于:文本挖掘/个性化推荐/用户画像/广告/图像/语音等熟悉Java/python开发语言,掌握hadoop/hive/odps/spark等大数据开发技术有相关数据挖掘竞赛完整的参赛经验优先考虑,获奖更佳!能力三核模型分析
数据挖掘.jpg
综合结果如下知识
1、本科及以上学历(5)
2、数学、计算机、统计学等相关专业(4)
3、熟悉hadoop/spark/hive等大数据技术(3)
4、坚实的数据挖掘和机器学习理论基础(2)
硬技能
1、2年及以上工作经验(3)
2、掌握分类、聚类、回归分析、机器学习等常规算法,并有建模经验(5)
3、掌握数据分析(2)
4、掌握java、python、scala等一种开发语言(4)
5、熟悉实时和离线大数据处理(1)
才干or软技能
1、较好的沟通表达能力(2)
2、较强的学习能力(2)
3、较强的逻辑思维能力(2)
4、较强的自我驱动力(1)
个人经验
数据挖掘工程师另外一个叫法是算法工程师,一般大家区分的不是很严格,其实算法工程师是大数据岗位中系分最多的,比如机器学习、自然语言处理、视觉算法、推荐算法、语音算法等,特别是近2年AI大火,也促使了这些细分领域的快速发展,所以算法工程师一夜之间都变成了AI工程师,人才需求量和待遇也是直线上升。
但是一般中小公司都没有这么多财力与物力(数据)做这么多细分领域的投入与研发,更多的是基于自己业务在某一领域的发展。而算法同学更多的是直接使用现有的算法包,通过不停的尝试特征变量或者尝试不同的算法包来提升效果并达到业务目标,这点本身并没什么不妥,只是大部分算法的同学将这2点看做是提升业务目标的核心手段,而忽视了本身对业务现状与问题点的分析,因此事倍功半。
系列文章
大数据岗位要求之数据测试
大数据岗位要求之大数据开发工程师
大数据岗位要求之数据仓库
大数据岗位要求之数据产品经理
大数据岗位要求之数据分析师
大数据岗位介绍-引子(能力三核模型)