3.2 数据挖掘在电子商务中的多面性

3.2.1 数据挖掘在电商行业中的常见案例

数据挖掘已经在商品数据化管理、各种网络广告组合优化投放、CRM(客户关系维护)和市场营销等领域取得了相当丰硕的成果,正在以不同程度地驱动让电商企业向前发展。下面罗列的是常见的一些案例,作为抛砖引玉,读者朋友可以先行独立思考。

1.通过数据指标判断一个电商网站是否健康就好比去医院体检,比如抽血化验,血小板总数、白细胞总数、红细胞压积容量、淋巴细胞百分比、粒细胞百分比等项目数据就类比于电商网站数据指标,通过指标就能判断网站是否运营良好,所以需要知道两类值:实际值和参考值。但是难点在于,如果没有足够的经验,往往很难将数据指标与背后的问题一一对应起来,这就是所谓的"先验知识"。如果一个店铺或者电商网站(快消品类目)有较长时间没有上新,那么以下指标一定会下滑的是?

A.浏览回头率↓ B.访问深度↓ C.浏览回头率↓ D.访问深度↓

2.因为某些商品(比如快消品中的真皮女鞋、羽绒服、皮草等)成本高、出货周期长或者其他原因,这些商品经常预售。某一销售旺季波段,凡是与预售商品一起下单的很多数额巨大的订单都因为缺货而导致大批订单未能及时发出,用户体验及其糟糕(拆单听起来是个不错的主意,但是成本变高并且实践证明客户并不喜欢接二连三的包裹陆续到来)。现在能做的无非是亡羊补牢的挽救措施,请你通过数据分析解决以下三个问题:

(1)请分析缺货产品的成分结构。经常会戏剧性地出现因为一个类似小吊带的小物件缺货而导致大批货物不能发送,如何避免?请给出建议。

(2)为了能给客户更好的体验,现在或许是唯一能做到并一定会起到显著效果的措施是什么?并计算成本有多大。

(3)预售商品导致不能发货的问题并没有完,还会衍生出其他问题。例如,某预售A商品与现货B商品被C客户同一天拍下并付款,但是当A商品到货后,C客户订单仍然不能发出,原因是原来的现货B被其他订单挪用,B商品也因为缺货而变成预售,无辜的C客户无奈只能一等再等。当然,接下来可能损失了一名C客户或者其身边的朋友。为了避免此种情况发生,请给出你详尽的数据支持方案。

备注:原始库存数据和订单数据此处略去。

3.一件女装刚刚上架,很多新客户一般不会轻易出手购买,请问大部分新客户的心理是在等待观望新品评价出来之后再购买,还是因为从众心理,等部分人群购买了才会出手。所以:

(1)请通过数据分析还原新客户在购买新品时的心态。对于新品或者新开张的店铺或网站,女人的哪种心态更多一点?

(2)运用此结论,如果你是一个女装主线品牌的操盘手,现如今欲创建副线品牌,如何操作才最可能成功?

备注:原始订单数据此处略去。

4.请你一口气列举出影响客户可能流失的40个数据指标用来组建客户预流失数学模型,且这些指标目前基于淘宝数据工具或者独立B2C网上商城运用GA(一种网站数据采集工具)并结合ERP系统都可以抓取到。如果该预流失数学模型用在精准会员营销方面,你将策划哪些营销方案?为了使客人最终成为忠诚度极高的客户,请给出你的连环精准营销方案。

5.在女装商品标题进行SEO的时候,常常会使用热词比如韩版和欧美等一些搜索量很多的词汇,显然热词会带来更多的自然流量。问题是:

(1)热词在提高流量的同时是不是对转化率也会有一定程度的提升,姑且不论提升程度的多寡,但是会有一定量的提升吗?请不要一拍脑袋就流利地说出答案,因为每个决策都会影响到隐性和显性的销售额。

(2)对于一个成熟的电商网站和店铺,热词有时候可能与品牌调性不合,如何权衡此问题?

备注:原始流量和销售数据此处略去。

6.现有一定量库存商品(女装类目),为了尽快释放出现金流,公司想把这批库存消化。如果你主持这件事情:

(1)你打算从什么角度来分析库存结构?

(2)按照优先级,哪些子类目的库存应该最先清理,依据是什么?

(3)通过对不同地域的客户群购买特征的数据分析,你能得到什么样的结论并基于此结论制定何种有效的清仓计划?

(4)为了防止库存积压的事件重现,请你通过数据分析,能否给出在订货时间节点和数量两方面的弹性补货机制,并依据女装的销售生命周期,在保证库存量和公司利润兼容的情况下,选择什么样的清货流程才最佳?

7.在女装类目中(也包括其他服装类目),视觉效果表现往往需要借助模特去表现,因为服装只有穿在模特身上才能完美诠释神韵,但是模特是有生命周期的,而且品牌风格的转变也是需要更换模特。在更换模特的时候,原来的女性客户往往表现出不买账抑或不支持的声音,而且通常反对声音都是相当的激烈。这是很正常的,风格转型必然会遭遇阵痛,不可避免。但是,女人心理的天然属性意味着即使有再多反对声音,也会有噪音,也永远不能完全还原整个事件的真实状态。问题是,转型意味着改变而不一定意味着朝好的方向改变。老板很纠结,在大批老客户反对声音中,无法拿捏准是不是应该坚持转型。

(1)你应该从数据的哪些角度分析模特转型是否成功呢?经过客观的数据分析结果表明,倘若模特转型是成功的,也给老板尽早吃一颗"定心丸";倘若转型不成功,也给老板提供决策支持,及早防止老客户开始流失。

(2)衍生另一个问题。大家都在谈论"意见领袖"的作用,女模特几乎每个女装电商企业都在用,从需求角度上说,一些成熟有财力的女装电商企业都希望得到在平民中有较高影响力和号召力"意见领袖"模特。问题是,"意见领袖"发挥的作用究竟有多大有没有比较靠谱的方法分离出来以便进行合理的量化呢?比如请网络红人代言天猫商城,取得成功的可能性有多大?

(3)目前女性SNS(Social Network Site,社交网站)分享做的比较优秀的平台有"蘑菇街"和"美丽说"。利用上面结论,请你预测一下,如果这两个平台上具有超高人气和众多粉丝的美丽达人自己开一个跟她风格比较搭的网上小店,你觉得她市场号召力有多大,能不能快速地做起来(在启动资金完备但不是烧钱的前提下,且供应链基本顺畅)?说明:此问题伸缩性较大,所以只要给出数据分析的思路即可。

8.以下问题稍微技术性强一点。快消品客人的生命周期通常服从以下何种分布?

A.幂函数分布 B.负指数分布 C.正态分布右半部分 D.不确定

9.新客户再次回头购买的概率比较低,假如目前只有20%左右回头。为了提升新客户的二次购买率,现进行新客户数据库营销。最简单也是最容易操作的是发放10元优惠券鼓励新客户感受二次购物体验。为了使客户对我们的优惠券保有量并不总是充足的(客户优惠券保有量过多对后续营销活动会有所钳制),优惠券有效期设置为一周。但是,实际测试的营销效果并不理想,优惠券使用率不到8%,尽管跟优惠券营销的老套过时有不小的关系,不过,这不是该问题需要讨论的内容。请用数据分析说明:

(1)影响优惠券使用率最重要的因子是什么?

(2)我们猜想,按照常理推断,刚刚进入网购的客户(这可以从淘宝或者独立B2C商城的信用等级来大致区分,比如一颗心的客户与一黄钻的客户相比,前者网购时间大概不会太长),应该更在乎优惠券,而网购达人应该觉得优惠券不是很稀罕。请从数据分析的角度来预测,如果新客户营销方案改成二颗心以下(含两颗心)的客户使用优惠券营销,而两颗心以上的客户改用其他更有新意一点的营销方式,那么10元优惠券对两颗星的新客户刺激购买是否有显著提升作用呢?

备注:原始优惠券、客户等级数据及订单数据此处略去。

10.客户沉睡周期如何划分才有利?如果周期过短,也许会打扰到客户甚至引起客户逆反心理从而造成了客户永久性流失;如果周期过长,对于沉睡客户的唤醒是极为不利的,其可以唤醒的概率会伴随周期的变长而急剧衰减。

3.2.2 数据挖掘是有巨大价值的,但结论常常是错误的

数据挖掘显然不是万能的。比如在广告投放方面(任何一个规模公司,不论去梅地亚中心进行广告竞标,还是在各大门户网站硬广投放,广告费用都是不菲的),希望能对目标人群进行精准投放。地毯式的广告会吸引人的注意,但是未必会引起别人的兴趣。假设我们经过数据挖掘得出30~45岁的年轻高级白领女性是我们的潜在客户,并且经过进一步分析知道她们经常登录的社交网站及习惯出入的公共场合。于是,我们依据数据挖掘的信息实施广告的定点投放,但是发现目标受众的响应概率只有15%左右。高达85%的受众人群对广告置之不理,看起来是一件相当沮丧的事情。换句话说,对大部分的个体消费者来说,数据挖掘的人群定位差不多都是错的。

尽管数据挖掘不是很精确,但数据挖掘是有价值的。虽然预测出来的受众人群只有15%产生了效果,但是相比没有使用数据挖掘,凭经验或者漫无目的地全方位的广告轰炸,效果要好得多,就像现在推销保险如果继续采取挨个电话推销,很容易把客户打死,下次再想把保险推销出去就会变成几乎不可能事件,所以,讲究策略很重要。没有方向性的广告实际上就是广告的随机播放,碰见目标用户的概率极低,可能只有2%的客户响应。从商业角度来解析,数据挖掘过程换来15%的响应客户是非常值得的。当然,从市场营销的另一个角度来说,正是因为数据挖掘在有些时候不是很精准,广告投放具有一定的随机性,才不会失去拓展市场的机会。所以,我们在广告有效投放的时候,也需要一些不确定性,保证吸引目标群体的同时,也教育或者培育可能是我们的潜在客户使之覆盖面更广。最好的比例可能是希望广告吸引来的80%是我们现在的客户,20%是未来客户,"二八法则",总之为未来潜在的客户也预留覆盖的机会。假如有一份广告,95%的客户都产生了购买行为,从眼前来讲,这份广告是异常成功的,其实不然。从长远目光来看,这份广告的受众面过于狭窄。

根据多次试验条件下,得出某项活动的人群响应率。我们针对活动可能吻合的消费人群进行评级,越评级高的对活动响应率越高。

一般情况下,在广告投放之前,都会进行必要的评估。比如在大型门户网站上投放广告,我们可以根据已有的数据模拟一下广告的效果,比如,用与CPC进行比较,看看广告是否值得投放。其中,UV是网站访问人数,CPC是广告每次点击花费的成本。

3.2.3 客观认识数据挖掘

数据挖掘工程师在某种意义上讲,他们是电商操盘手的"军师"。数据挖掘最重要的支撑点在一个"挖"字。何谓"挖"?就是凭经验和肉眼看不出来的现象和行为规律,通过数据分析展示出来。所以,数据挖掘一定是预先没有的结论而通过各种方法的分析从数据中提取出来的,而不是一眼看出来的,比如在电子商务数据挖掘关联推荐的案例中,作者曾经碰见通过挖掘3C商品(Computer、Communication、Consumer Electronics)订单数据来找出关联商品,不过不幸的是,得出的结论常常是尴尬的,比如得出这样的结论:经过对海量数据进行挖掘,发现手机和手机壳的关联性特别大。实际上,得出的关联销售结论是正确的,只是用处不大,因为该结论再现了商业常识。换句话讲,从数据里挖出来的结论引导公司运营,而不是用肉眼看出显而易见的结论,然后罗列数据去佐证它,这中间的逻辑关系不能本末倒置了。数据挖掘最肤浅的表现是所从事的行业背景与统计学技术之间找不到挈合点,更甭提大而化之地、夸夸其谈所谓的"数据驱动运营"了。

我们还要警惕数据的"小数定理",这也是数据挖掘的局限性之一。与之相对应的,从统计学的角度已经知道,"大数定理"告诉我们,样本越多越会接近事情的真相。但是,很多时候在进行数据挖掘的过程中,纵然样本很多,技术使用非常高深,还是会出现情绪性的偏差,数据挖掘的结论几乎总是收敛于50%左右,这让数据挖掘陷入困境。比如在女装电商公司,为了减少库存的压力,常常采用"预览"策略,就是客户可以对商品进行收藏和评价,公司会根据女性客户"民意"走向来大概预估商品的阶段性销售数量。但是,经常事与愿违,之前看起来喜欢该商品的女性客户等商品真的上架销售之后,很可能不再买。这样案例还有很多,不管采集的样本容量有多大,结论总会出现不可控的情绪性偏差,尤其在女性各项消费领域表现尤甚。因此,尽量缩短女性客户的思考时间有利于提升商品转化率(注意:"思考时间"跟"停留时间"是截然不同的两个概念,不要混淆)。

另外,正确运用数据挖掘模型,否则就不能达到预期目的。在电子商务行业会经常使用RFM模型来进行会员营销。对于CRM维护,作者看到近年各种CRM软件如雨后春笋,都在抢占市场。巧合的是,每个CRM软件里面似乎总有一个叫RFM模型:最近一次消费时间(Recency)、消费频率(Frequency)、消费金额(Monetary)三个方面。这个RFM模型最早来自美国零售行业,被我们电商业界移植到国内电商CRM环境下,不仅对客户群体的划分粗糙,而且是水土不服。看起来有经典理论作为支撑,宣传起来也有理有据,但是实际效果定然不痛不痒。数据挖掘会经常用到数据建模,比如这个RFM模型用于对流失客户的聚类上,除了R/F/M要素之外,仅对于淘宝卖家(其他独立B2C网上商城类似)来说,买家中差评和投诉的频率一定直接影响到客户是否流失但无法体现在RFM模型里。至少,这个经典模型需要修正。我们看一个运用人工神经网络基于RFM模型来预测客户的留存问题。神经网络的结构,最上层四个点分别表示R/F/M三要素和中差评次数这四个指标,中间一层是神经网络的CPU处理器,最下面一层是预计留存的结果(继续保留或者流失),这里面还耦合了很多高新技术,就没必要说明了。我们训练客户样本数为46053对,计算机经过三天三夜的不间断计算,样本预测结果如下所示:尚存客户(没有流失的客户)的预测准确率47%,流失用户的预测准确率70%(该公司的客户回头率极低,为15%~20%之间波动)预测效果非常差,通过此案例,我们至少得出四方面的启示:

RFM模型虽然经典,但是并非放之四海而皆准,需要结合实际使用情景。

数据分析样本的选择特别重要。

并非技术越高级、越华丽,得出结论就越有价值,实用性总是第一位的。

再现了"小数定理",虽然样本较多,技术很高,但是预测结果很差。


本文由转载于互联网,如有侵权请联系删除!