信息革命、信息化、信息社会、信息时代……这些当下耳熟能详的词汇,流行的关键在于“信息”二字。借助现代信息技术,规模化、定制化、高效地生产、采集、处理、存储、传播、利川信息,是信息社会区别于农业社会和工业社会的主要特征,也是信息社会变得更为聪明、更为智慧的要诀。

众所周知,信息革命本质上是一场信息数字化革命。缺少数字化信息,便无从发挥计算机出色的处理能力,也就无法展现现代信息通信技术的强大优势。信息的原始物理形态虽然多种多样,但在汁算机内都表现为一系列 “0”和“1”组合所代表的数据。计算机中的信息处理,便表现为对数据的处理。因此,数据的采集、存储、处理、分析利用和传播的水平,也就代表了人类开发利用信息资源的能力和水平。

正是“数字化”开启了信息时代的——扇崭新的大门,为人类开发利用信息资源带来了新模式、新技术和新方法。1946年世界上第一台电子计算机诞生至今已有60多年,这期间数据处理技术大约经历了三个主要发展阶段。

第一个阶段是20世纪60至80年代,这期间数据开发利用的主要方式是数据库(Data Base)。各行各业开发了大量功能各异的信息化应用系统,典型代表就是企业操作层面的数据处理系统和管理层面的管理信息系统。这些信息化应用系统的主要任务是采集各种业务流程中的数据和信息,采用自动或半自动的方式进行组织并按照特定格式存储到数据库中,以支持业务活动的运行和管理。

20世纪90年代以来,迅速发展起来的商业智能(Business Intelligence)成为第二阶段的主要特征。商业智能形成了“关系数据库→数据仓库→数据挖掘→数据可视化”的一整套技术和产业链,极大地推动操作与管理层对数据资源的开发利用。商业智能的主要目标是对决策信息资源的充分利用,不仅使信息成为决策之基,而且利用数据挖掘及可视化工具,使决策活动更为“智能”。当然,无论数据库技术还是商业智能技术,处理对象都是结构化数据。

二十一世纪以来“大数据”开始受到人们广泛关注,这标志着数据处理技术迈入第三阶段——一个更充分、更彻底、更高效开发利用数据资源的新阶段。人类社会数据量指数级的增长宣告着大数据时代的来临,这是全球信息化快速发展的必然结果。尽管大数据中蕴含着极为丰富的业务知识和有价值的决策信息,但如何利用这些数据来发现新识、创造新价值,已成为科学技术和经济社会发展面临的一个新挑战。

大数据以“超大量级”和“非结构化”为主要特征。在大数据面前,从前的数据库技术和商业智能技术都显得“心有余而力不足”。因此,大数据处理、分析和利用等问题便迅速提上了信息化发展的议事日程。这是数据资源开发利用向高端演进的一个标志,也是当代科学和技术发展的一个前沿,甚至有可能成为一个新兴学科——“数据科学”(Data Science)的核心内涵。

Frank Ohlhorst所著的这本书,是目前众多介绍大数据概念、方法和应用中较有特点的一本著作。Ohlhorst是一位知名技术专家,且长期担任企业IT咨询顾问,具有丰富的信息技术实践经验。全书以大数据分析的商业及金融价值为主线,对大数据这一崭新的领域进行了全面的探索,不但向读者阐明了大数据分析的重要性,更淋漓尽致地展现了大数据分析的具体过程。与其他同一主题的书籍相比,本书的引入之处在于作者分享了大数据分析在诸多行业的应用经验,以及如何在商务视角下对数据进行挖掘,怎样从数据中获取价值形成竞争优势。

大数据时代的来临,正在唤醒国人对于数据资源开发利用的重视。当务之急,不是一哄而上炒作大数据的概念,而是脚踏实地的研究,不断思考并总结如何提高我国数据资源的开发利用水平,加快缩小我国与发达国家的信息化差距,特别是在数据资源利用效率和效果方面的差距。王伟军教授等人在百忙之中翻译了Ohlhorst的这本书,切合我国当前大数据技术发展和应用需求,可谓相当适时。本书抛砖引玉,不仅能为有志利用大数据技术提升企业利润、提高服务水平进而获取持续竞争优势的各位企业家带来指导与启发,对我国大数据及数据科学教学与科研水平的提高,乃至大数据分析技术在我国更为广泛的推广,也将起到积极的促进作用。

是以为序。

国家信息化专家咨询委员会常务副主任

2013年6月28日于北京


本文由转载于互联网,如有侵权请联系删除!