“你自己多想想……”是很多新手数据分析师最怕听的话。那到底该咋个“多想想”。本文将会为您推荐一个数据分析思路,有需要的可以阅读。
“你自己多想想……”是很多新手数据分析师最怕听的话。如果前边还加个自己不熟悉的业务,比如“做个内容分析,做个售后分析,做个呼入分析……你自己多想想”,那就更难受了。到底该咋个“多想想”,今天我们系统看下。
问题场景:
某个互联网厂子,领导对说:“做个积分分析,你自己多想想”。
一、从业务场景开始
之所以觉得难下手,是因为这里是两个问题,不是一个问题。
问题一,业务知识:到底是什么业务的,什么样的积分??
问题二,分析目标:这个积分到底啥现状,要分析出什么东西?
两个东西都不清楚,就如同盲人骑瞎马,当然毫无头绪了。
破题,要从业务知识开始。如果连业务的基本情况都不清楚,那就根本没法分析了。而且在梳理业务的过程中,可以收到业务人员的感性反馈,比如:
这些感性反馈, 可以成为梳理分析目标的起点。
二、业务梳理逻辑
梳理业务,可以依照:来龙去脉,整体局部的顺序进行。搞清楚这个业务的上游、下游环节。从而梳理出最粗框架的业务流程。
以积分为例:
整明白这两个问题,就能理清积分的业务流程。以电商业务为例,常见的积分来源、消耗方式如下图:
梳理出粗框架业务流程以后,可以落实数据来源,即这些环节的数据有没有记录,有没有清晰的记录,在哪些系统进行记录。以积分为例,很有可能系统自动产生的积分,比如消费积分,是有清晰记录的,能具体到每一笔交易。但是活动赠送,人工调账的,很有可能没有详细记录是哪个活动/哪个投诉补偿进来的。
数据分析最大的难题是:没数据。在梳理业务流程的时候,要提前发现这些问题,避免事后查数据库的时候,面对一堆莫名其妙,没有标注的数据。
以上两个工作,可以不和业务部门沟通,直接顺着业务流程/系统流程/数据字典去查,但是仅仅做这两步,很有可能得到一个:知其然,不知其所以然的结果。
更深层的原因是不知道的,比如:
很有可能这些设计的背后,有特定的业务目的。这些业务目的不是直接留在纸面文档里的。
因此,梳理工作不应停在仅了解流程/数据上。还应该再梳理:业务动作。理解了业务部门出于什么目的,做了什么事,才能理解数据背后的东西。很多常识性的结论可以直接从这些问题里获得,进一步分析的灵感也能从这里来。从而极大的避免:分析了一堆,业务说“我早知道了”。
当然,不同公司沟通难度不同,这一点上同学们量力而行。能沟通清楚,是最好的。
三、基础数据呈现
在梳理完业务后,可以做基础数据呈现。基础数据呈现也要遵守:来龙去脉,整体局部的原则。先呈现基础情况,再发现问题。
比如积分情况,可以讲:
呈现完现状以后,根据之前梳理情况,后续有不同的做法。