最近读了《大数据时代》这本书,主要是因为现在大数据是一个比较热的领域,是未来的一个很重要的发展方向,听说这本书写的非常好,所以就花几天看完了这本书,这本书没有什么技术上的内容,主要是介绍了大数据的这种思想和趋势,“a revolution that will transform how we live, work and think”,这是这本书主要讲的内容,书中分了三大章节讲述思维变革,商业变革和管理变革,每部分都有很多的公司实例作为例子支撑。读完这本书之后,总结一下自己记住的东西:
大数据就是海量数据。掌握海量数据,能分析海量数据,有大数据思维的公司掌握未来。
统计学原理。样本=总体,这是在统计学领域中大数据带来的最重大变革,以前由于各方面原因,如技术,时间等,无法处理海量数据进行统计分析,所以采用了随机抽取样本代替总体这种办法,然后进行统计分析得出结果,但是这样的方法存在缺陷,依赖于样本抽取的随机性。而现在,由于技术上可以处理海量数据,那么可以样本=总体,这样数据不会丢失,更加合理。大数据分析不注重因果关系,注重相关关系。这一点我不是完全同意,但是做着说的也在理,可能要具体问题具体分析,比如他用Google公司利用用户的搜索记录分析出了美国流感可能发生的地方,然后上报国家,预防了流感的大面积传染。这种情况下无需知道流感因何而起,只要知道流感相关的发生地就行。没有无用数据,没有错误数据,没有过时数据等等。所有数据都有用,而且可以使用不止一次。所有数据都有价值,放弃数据的精准性,正确性,接受其多样性,丰富性。大数据技术可以预测未来。但仍有问题,如预测犯罪。
个人隐私保护问题,这是大数据时代面临的重大问题。 看了一遍能记住的东西就这些了吧,总体来说这本书还是不错的,属于大数据思想的启蒙教育书,其实在看这本书之前也对这方面了解一些,但也只是知道一些名词,这方面Google是比较强的公司,现在正在慢慢的看,如NoSQL数据库技术,Hadoop技术,MapReduce技术等等,以后会慢慢了解这方面的东西,因为感觉未来确实大数据分析很重要。