视频及PPT的下载地址:请点击这里下载>>
大家好,非常感谢畅享IT跟大家一起做大数据的讲座这场活动,其实大数据这块这些年非常热,我个人认为很多企业都想上大数据,我觉得从大数据上来讲它更是一种思维方式,不用把大数据想的太复杂,它在日常就是存在着的,我举个前几天发生的例子,前两天我跟几个同事在上海打出租车,我们四个人中午站在马路边上,很多司机看了我们一下都不停,当时我们觉得很诧异,我们四个人长的都不是坏人那为什么司机都不停呢?后来好不容易打到辆车,我们就跟出租车司机聊这个事情,出租车司机都说,你看你们四个人,实际上这个就涉及到大数据的一个维度就是四个人的维度,另外一个是大中午,他说你们四个人大中午的来打车,肯定是在市区要么吃个饭,要么开个会,这条路又堵所以他就不想带,这里面实际上大数据的核心是一种决策的过程,它是通过多个维度来进行决策,实际上这个司机已经考虑到了几个维度。平常有人说大数据和我们传统的这个报表有什么区别,实际上我们报表基本上是二维的,就是说你的生产产值是多少、比例是多少,是二维来看这个报表。大数据实际上是一种多维的思考方式。刚才那个例子其实已经讲了好几个维度,一个是时间维度、一个是人数维度,而且我认为这次分享的题目是:企业大数据实战经验分享,其实大数据并没有什么高深的东西,它都是存在于我们生活之中,我觉得并不是一种技术,更多的是一种思维方式,不光企业里有,包括出租车司机也有,后来司机跟我们讲:如果说你们把维度从中午改成晚上,那么我一看到你们四个人就很愿意拉,实际上意思是,如果晚上的话大家喝完酒出去4个人、1笔生意就等于4笔生意了,其实大数据的核心如我这边所说,一个是要多维分析,另一个是要有决策。
并不是我们企业弄一堆表。这个例子也是我们讲大数据一个精髓的地方,不管用什么手段,能给企业带来生意、给领导提供决策这才是做大数据有用的地方。现在世界杯已经过去了,实际上通过大数据大家也知道这次德国队的冠军,这里面也涉及到了传统的报表和大数据区别的问题,从2014世界杯预选赛开始,德国队就开始使用SAP足球解决方案(SAP Match Insights)进行数据分析,该方案在SAP HANA内存数据库平台上运行,记录球员的跑动路线和传球路线。通过对这些数据的深度分析,教练能了解到球员的状态如何,以及怎样对训练内容作出调整,提高训练质量并制定高效的训练计划,为训练、备战和比赛情况的分析工作提供便利。在巴西世界杯期间,德国队在每场比赛结束后都会用SAP Match Insights进行赛后分析,为下一场比赛做好充分的准备。听足球解说,基本上不是我们说的报表,传统报表主队控球是多少,时间是多少,这些东西是传统的报表是一个二维模式,通过大数据多维模式的分析,它把动态的采集每个球员的点做一个适时决策,实际上通过多维分析更能快速决策另外德国队确实没有那么多球星,通过这些新的手段拿到世界杯。下面我再来讲一个例子,大数据的核心是为决策提供数据支撑,做建模,如果说你建模建的不好的话很难得出你要的结果。
在德国队和阿根廷比赛前几个小时,我发现德国队的支持率在上升,而阿根廷的支持率在下降,那么大家想一想如果说按照这种情况,应该支持德国队的人多,支持阿根廷的人会比较少,那么当时出现很奇怪的一个现象,按理说你支持的球队的人增多的话那么它的赔率应该是下降的,但是当时买德国队的人多反而赔率上升了,如果说普通的建模的话这个东西肯定预测不出来了,不符合现有的情况。实际上这里面涉及到如何建模的一个问题,如果说你一个人给一个票这样建模的话,肯定是不行的,而且你决策出来的结果肯定是错的,那么这应该要怎么建模呢?实际上对人的话要增加一个属性,大家如果做股票的话,就知道股票里面有散户和主力,散户的资金可能比较少,主力的资金比较大,一个散户的资金占有额和一个主力的资金占有额肯定是不一样的,博弈公司是根据总的资金数来做这个平衡的,那么支持德国队的人越多赔率为什么越大呢?其实这就说明一个问题支持德国队的人都是散户,他的资金量不是很大,虽然支持阿根廷的人数比较少,但是平均资金额多,就这种情况我当时就做了一个大胆的预测,球市如股市,总是往散户最难受的额方向运行,50分钟打平的概率大,赌德国赢得输一半,后来也证实了我的预测是对的。如果你建模的时候只考虑到一个人,没办法得到决策的,但是如果说你在建模的时候考虑到散户和主力,会对你的决策有帮助。