在这金九银十的美好季节,蠢蠢欲动的我诞生出了探一探数据分析市场需求的想法,于是我的面试之路就这么开始了~

由于我个人有面试复盘的习惯,所以今天刚好给大家分享一下我在面试的各类企业数据分析相关岗位的面试经验,大家也可以借鉴下我的这个面试复盘的习惯,我觉得复盘-总结-提高还是很重要的

大数据优质经验分享_经验分享型软文_经验分享平台有哪些

有道云上写了很多篇面试复盘

提前说明,我选择的企业大多是400~2500人之间的中型企业,个别是10000人以上的大型企业,行业主要分布在互联网和零售领域。之所以这么选择是因为:

小公司或者刚起步的业务没必要用数据分析,或者数据分析较难发挥作用小公司没有可供分析的数据量或者维度互联网和零售是数据分析需求较大的两个领域中大型企业的业务一般是处于快速第一曲线的快速增长期或者第二曲线的起步阶段,比较适合数据分析的发挥

以下进入正题,开始各类公司面经,具体公司名称我就不放出来了,大家自行揣摩。各位看着问题也可以自己思考下。

某供应链整合公司 2B业务 自有平台 500~999人 大小周

公司环境不太行,办公室很乱,问的问题比较简单

如何搭建指标体系?针对不同人群,怎么搭建不同的指标体系?日常报表怎么设计的?为什么想离职?支持了哪些业务?做了哪些支持?带来了哪些成果?SQL怎么样如何看待取数工作?如何应对取数需求?某母婴电商类公司 2C业务 自有品牌 自有小平台 主要业务依托淘系,抖音直播电商等 500~999人 近乎大小周 细分领域TOP1

总体感受:一般,前台和一个女面试官态度很冷淡,面无表情,男面试官很不错,态度很好,哪怕没答上来也会引导。

面试记录:

个人介绍,没什么好说的问了下最近一份工作的业务模式和商业模式问最近一份工作经历中,自己觉得最有成就的是哪个项目?(问了我怎么做的,用了什么模型,效果如何,如何评估效果的)营业额下降如何分析?新品上市怎么分析?分析方法如何产品化?社群运营和普通运营的区别是什么?有什么优势?1~100之间偶数和是多少?hive如何避免数据倾斜?sql怎么在现有的表中新增一列,语句怎么写?查询连续三天登录的用户id某区块链业务公司 2B 500人左右 自有产品和平台,主要做风控

1.自我介绍

2.说下最近一家公司的业务模式

3.针对上家公司的三种业务模式,说一下风险点和解决策略

4.作为滴滴平台方,如何防止订单中发生风险(司机侵害乘客)

面试官答案:基于app用户行为来判断:

手机型号订单过程中是否偏离规定路线通过调取输入法信息,判断是否输入敏感词行程通话录音语义识别乘客是否酒后驾车获取app列表找合作公司获取安全信息获取聊天记录某老牌游戏公司 2C 1000~9999人 自有产品和平台 面的是直播业务条线,行业TOP5 已上市一面SQL题:两个表,表user_info有员工ID,员工姓名,部门ID,员工薪水四个字段。表depart_info有部门名称,部门ID两个字段。求各部门薪水最高的员工ID,员工姓名,薪水,部门名称

这个easy,leetcode上全是这种题

2. 两个表,表1有用户注册时间,用户ID两个字段。表2有用户登陆时间,用户ID两个字段,求用户注册留存矩阵。

结果如下:

经验分享型软文_大数据优质经验分享_经验分享平台有哪些

第一列是日期,第二列是当日注册人数,第三列是第二天留存率,后面就是三日留存,一直到7日留存

答案大家想想,想到答案的可以发到评论区里。

二面:

面试官是运营负责人,听起来年纪有点大,问的问题比较随意

自我介绍为什么想从实体转互联网(答:上份工作基于平台,各方面受限,想找个有自己产品和平台的公司,更好发挥自己的价值)数据分析市的团队定位是什么,价值是什么抖音为什么使人上瘾,哪里做的比较好,推荐算法的逻辑是什么?你有什么问题想问的三面:估算某直播产品的充值量级。及如何估算的?方法是什么直播的商业模型有哪几种?语聊房属于哪一种商业模式?你认为语音房最重要的核心指标是什么?用户生命周期(ltv)如何计算?如果ltv指的是包括未来的收入及留存 大概说一下如何计算

第一个问题知乎有很多类似问题的解,该类估算问题主要还是从指标拆解入手,再结合一些行业公开数据进行估算

第二个问题:

直播产品商业模式有以下几种:

1.礼物打赏。观众充值后购买虚拟礼物送给主播,主播再提现。若主播有隶属的工会,则由工会与平台方结算,后工会向主播发放工资。平台赚取礼物扣点费用。

2.导购电商或新零售。主播通过直播平台经营店铺,通过直播来引导观众下单消费,例如抖音直播电商或淘宝直播电商。平台按一定费率抽单或按照营业额分成。

3.广告投放。主播通过平台接单,或平台自主接单,广告主通过平台按照cpc或cpm模式付费投放广告。最终将投放的广告在直播间展示给观众观看,例如斗鱼直播广告。平台按照一定比例及模式来收取广告费用。

4.付费直播。依托于平台,一般有主播付费开通直播或观众付费观看直播两种形式,例如各类培训班的直播课。平台赚取主播或用户开通/观看直播的费用。

5.增值服务。例如会员体系,权益系统,直播工具等。平台赚取主播或观众的增值服务费。

第三个问题大家自行探索,个人认为是直播间平均观众收听时长

第四个问题:LTV=LT*APRU=(统计周期内每日留存率之和)*(统计周期内收入/统计周期内用户数)

知乎上有很多计算LTV和APRU的优秀文章,大家自行探索

第五个问题:利用模型做预测,具体是线性回归还是什么要看具体情况

某新零售独角兽企业 1000~9999人 双休,自有平台,阿里系,行业TOP3一面:问我为什么转行,怎么转的?你是怎么挑选行业和企业的?工具是怎么学习的?自己想学还是工作需要?讲一下对我司品牌和业务的看法和认知,觉得有什么缺陷?需要怎么改进?二面:介绍自己做的项目如何分析活动上家公司的商业模式,利弊点活动分析相关的指标体系如何搭建活动分析相关的报表怎么设计

三面课题:如何设计并搭建一套智能线下门店选址的系统

三面:

关于智能选址的方案指定和选择

沟通了市面上几个主流选址产品的方案,分析了各种智能选址产品的优劣以及适合该公司的方式

基于分析结果进行讨论,对未来该公司智能选址平台的搭建提出了预期和计划的解决方案。并预测所需成本。

某餐饮SaaS公司 2B业务 500人左右,行业第3~第5之间一面:自我介绍,深挖简历关于NLP项目,都选择了那些模型,为什么选择BERT?如何判断模型质量?怎么没用Kmeans?B端商家如何做标签和分层?用户评价分析项目落地后如何跟进效果?怎么评估效果?上家公司门店生命周期多久?品牌生命周期多久?

二面:自我介绍如何给地推BD团队搭建指标体系?如何帮助BD提高业绩?B端分析和C端分析有什么差别?如何提高商家营收?有哪些分析思路?某智能大屏公司 准独角兽 500~999人 自我介绍介绍项目如果你来我们部门,你会关注哪些指标,为什么怎么搭建的指标体系怎么提高会员ltv,讲一下分析思路项目细节,看报告某网红直播带货平台 1000~9999人 主要业务有mcn和直播电商saas

面试官印象:年轻男性,学历高,理论知识很强

面试问题:

简单介绍下购物篮分析支持度置信度提升度什么含义?如何基于这三个维度来评判一个商品组合的好坏?三个指标优先级和权重如何定?三个指标的标准如何定?关联规则除了Apriori还有哪些?关联规则的统计原理是什么?频繁项集怎么定义?RFM是什么?中心极限定理是什么?线性回归有哪些?有什么区别?标签体系怎么搭建的,你在其中扮演什么角色?如何落地你的策略?有什么困难点?怎么解决?某智能物联网公司 自有产品和品牌 10000人以上 已上市 市场TOP1如果你负责的项目涉及一个你从没接触过的业务,你会怎么开始?如何看待杜邦分析法?讲一个项目如何搭建指标体系的?数据仓库知道多少?数仓有那几层?如何进行数据建模?hive会吗?对某张上亿条数据的大表做增量抽取,ETL的时候需要注意什么?SQL优化有哪些方法?什么是假设检验,假设检验的背景是什么,什么时候要做假设检验,假设检验有哪几种方法,每种方法的使用场景和区别是什么,做假设检验的时候要注意什么,偏态的数据对假设检验的结果有怎样的影响,怎么处理可以消除影响,怎么分发流量?朴素贝叶斯是先验还是后验?一般用来做什么?原理是什么?机器学习中调参的方法有什么?一个数据挖掘项目的标准流程是什么?什么是特征建模?怎么做?

要求能力:产品经理 项目经理 数据分析 数据运营 数据仓库 ETL 数据产品 数据挖掘 BI

某海外市场新零售公司 自有平台 1000~9999人 自我介绍(每个公司的业务和自己的职责)介绍一个你觉得比较好的项目你在其中担任什么样的角色,做了那些事情?kmeans怎么确定最优的K值?kmeans的原理是什么?除了用欧式距离还有什么距离?现在运营要做一个满减活动?如何复盘?如何预测一个新的会员运营策略后续能给我们带来多少会员数增量和会员订单增量?以及后续活动的成本和ROI?因子分析的原理是什么?怎么做?sql求一个日期表中最大日期的那一行,怎么写?sql窗口函数中,partition by有什么用?和group by有什么区别?你怎么从制造业转到互联网的?你的职业规划是?为什么想做商业分析或者数据产品?对各个BI产品的优缺点分析?(Tableau,PowerBi,FineBI)如何看待取数这个工作?你是怎么选择行业和公司的 ?如果业务方不采纳你的策略和意见 你怎么想 ?某通信行业外企 10000人以上 老品牌笔试题:

Python题

有一个表被导入了python中,命名为a

经验分享型软文_经验分享平台有哪些_大数据优质经验分享

第一题:

将class1~class5列去除,增加class和grade列,使新的dataframe和旧的dataframe内容一一对应,新dataframe命名为b

类似这种效果:

大数据优质经验分享_经验分享型软文_经验分享平台有哪些

第二题:

将b表的test列分为final和midterm两列,效果如下:

经验分享型软文_大数据优质经验分享_经验分享平台有哪些

考察点:异常值处理、行列转换、透视表

SQL题:

有一个表T,一共三列,分别是SNO,SUBJECT,SCORE

SNOSUBJECTSCORE

1001

语文

90

1001

数学

40

1002

语文

80

1002

数学

60

第一题:查出语文成绩及格,数学成绩不及格的学生的SNO

第二题:查询出这三条记录:大于或等于80表示优秀,大于等于60表示及格,小于60表示不及格

POWER BI:

各表关系如下

经验分享型软文_大数据优质经验分享_经验分享平台有哪些

则度量值=CALCULATE(SUM('采购'[数量]),'日期表'[年份]=2020,'客户'[客户姓名]='张三')的含义是什么?

A.张三在2020年购买的产品数量

B.张三在2020年购买过的历史总采购数量

C.张三在2020年购买过的产品在2020年的总采购数量

D.张三购买过的所有产品在2020年的总采购数量

第二题:

订单表有10000条订单记录,订单记录可能重复,现已存在一个度量值:订单数=COUNTROWS('订单表'),若在订单表新建一列,计算列的表达式引用了上述度量值,那么该计算列的结果是

A.全为1

B.全为1,但可能存在大于1的值

C.全为10000

D.全为10000,但有可能存在等于1的值

第三题:

已知客户表和订单表为单项筛选一对多关系,客户表为一端,订单表为多端,且已存在以下度量值:

度量值=CALCULATE(COUNTROWS('客户表'),'订单表'[产品名称]='A产品')

若将上述度量值放入卡片图中,将返回哪种结果

A.空值

B.所有客户数

C.有购买记录的客户数

D.购买了A产品的所有客户数

面试:纯英文自我介绍介绍项目POWERBI建模POWERBI读取数据量过大怎么处理DAX考察SQL优化有哪些方法pandas数据清洗常用的方法报表体系如何搭建,怎么针对不同用户设计不同报表其余各类公司笔试题:

经验分享型软文_经验分享平台有哪些_大数据优质经验分享

经验分享平台有哪些_大数据优质经验分享_经验分享型软文

大数据优质经验分享_经验分享平台有哪些_经验分享型软文

经验分享型软文_大数据优质经验分享_经验分享平台有哪些

经验分享型软文_经验分享平台有哪些_大数据优质经验分享

大数据优质经验分享_经验分享型软文_经验分享平台有哪些

经验分享型软文_大数据优质经验分享_经验分享平台有哪些

大概就这么多,还有几家比较简单的我就不放上来了,大家自己练习一下~

手打不易,觉得这篇文章对你有帮助的话麻烦大家点个赞收个藏点个喜欢


本文由转载于互联网,如有侵权请联系删除!