文档介绍:甘世玉
女5年工作经验 1990年11月 已婚
现居住于上海-杨浦区 本科 户口江西-九江
手机:18
E-mail:
求职意向
大数据开发、数据仓库
自我评价
自学能力强,善于思考,吃苦耐劳,有良好的沟通能力,善于与他人相处,富有团队合作精神,爱运动。
专业技能
1、熟练linux、shell、pyhton、java、scala
2、精通oracle、mysql、teradata、sqlserver数据库、sql的开发和执行计划的跟踪与优化
3、精通hadoop、mapreduce、hive、hbase、spark、kafka、hue、oozie、impala
5、精通数据仓库的模型设计、数据转换、抽取和调度的设计
6、熟练NLP、TF-ITF、LCS、中文分词
7、熟悉CB、CF推荐算法和Kmeans、朴素贝叶斯、逻辑回归
工作经历
– 至今:XX快递
职位:大数据开发
汇报上级:数据架构师
企业规模:1000人以上(其中技术部门300人)
企业介绍:XX物流有限公司创立于2009年,总部位于上海青浦,是一家提供全国性快递服务的规模型快递企业
工作描述:
对各大业务系统、日志系统,结构化和非结构化数据进行实时与离线的采集
开发spark任务对数据进行清洗、计算、转换和推送,报表的开发以及业务系统的交互
拉链表、维度表、事实表和宽表等模型设计与开发
审核和优化spark任务,减少任务执行时间以及spark任务资源合理的分配与设置
对海量数据列式存储,以及kudu表和hive表分区存储与优化,数据倾斜的处理
运用NLP、TF-ITF、LCS等算法对文本进行相似度的匹配与归类
– :XX XX快递
职位:大数据开发
汇报上级:部门经理
企业规模:1000人以上(其中技术部门250人)
企业介绍:XX快递创于1993年是一家以经营快递为主的国内合资(民营)企业
工作描述:
主要负责数据仓库的设计、报表的开发,etl工具数据抽取、转换和加载,存储过程、mr和sql的开发以及调度
主要运用python、shell、sql、hive、sqoop完成日常的工作
对转换、sql、存储过程和mr任务进行优化,以及指导和审核开发人员的sql
数据库的存储优化,表的行列混式压缩并提高数据库查询性能、分区设计和分区自动化管理
数据分析和统计
–:XX XX信息科技有限公司
职位:数据库开发
汇报上级:项目经理
企业规模:200人
企业介绍:XX XX信息科技有限公司是中国教育信息化领域的重要软件供应商和系统集成商
工作描述:
oracle数据库的安装与配置以及数据库的设计,数据接口的设计与开发,存储过程、方法和触发器的编写,数据库的备份、数据库的优化和数据库的日常维护 linux服务器的部署与配置
项目经验
– 至今:
项目简介:
该项目是随着公司快递业务的增长,数据规模的增大,致力于给公司和网点人员提供可视化的数据监控和分析,提高快递的操作时效,降低公司成本,提高公司和网点的效益。该系统集成PC和APP,包括报表分析,成本收入预