COVER STORY 封面专题大数据虽然是继云计算之后兴起的一个热门产业,但在西方其实已经度过了成长期,开始步入大规模商业化阶段,而大数据产业在我国则还处于成长阶段,与西方有较大差距。我国发展大数据产业,既要吸收和消化西方先进的技术和经验,又要鼓励自主创新,迎头赶上。大数据产业的美国经验与中国对策/文 罗涛美国是全球大数据产业的发祥地,也是全仅如此,全球最大的芯片企业英特尔也进入大球大数据产业的中心,当前美国经济正在朝数数据产业,而全球最大的 PC 厂商惠普也在精简据密集型经济和以数据为中心的经济转型,大PC 业务,2011 年斥资 110 亿美元收购英国大数数据在美国已进入大规模商用阶段,美国是全据企业 Autonomy 公司,进入大数据业务。球发展大数据产业最成功的国家。初创企业层出不穷大数据技术创新速度快,而大数据产业的美国发展大数据产业的经验基础技术 Hadoop 是开源项目,这就为初创企信息技术企业纷纷转型业提供了极好的技术创新平台,而美国发达的美国是全球信息技术产业的领头羊,在硬风险资本行业为大数据初创企业提供了资本温件和软件领域都拥有超一流的实力,然而,早床。美国大数据的初创企业主要有两个来源 :在大数据概念火热起来之前,美国信息技术产最大的来源是大型信息技术企业员工出来创业。

业在大数据领域已经有了很多技术积累,这使大型信息技术企业固然人才济济,创新能力强,得美国的大型信息技术企业可以迅速转型为大但是也有弊端,很多优秀的科学家和工程师不数据企业。其中有的企业自身就是大数据技术断冒出好的想法,却不一定能受到企业的支持,的推出者,谷歌就是典型代表,大数据核心技在这种情况下,跳出大企业自己创业便成为一术 Hadoop 则是雅虎员工 Doug Cutting 根据谷歌 个极好的选择。第二大来源则是大学大数据技2003 年发布的学术论文研究而来。有的企业则术转移的结果,美国大数据产业的基础技术虽通过收购业内已经存在的大数据企业来建立大然出自大型信息技术企业,但大学开放自由的数据业务,典型代表是 IBM,自 2005 年以来,学术环境为大数据教育和科研提供了平台,通IBM 出资 160 亿美元收购了超过 30 家大数据企过教育和发表论文,大学成为美国大数据产业业。大数据不同于传统的结构化数据,而是充的一个重要推动力,一些教授和学生通过大学斥了非结构化数据和半结构化数据,美国在结技术转移的方式,组建大数据初创企业,是很构化数据库领域有数据库行业的领头羊甲骨文自然的事情。

因此,层出不穷的初创企业成为公司,但甲骨文公司也推出了大数据业务。不美国大数据产业不竭动力的一个重要来源。54 高科技与产业化 . 月刊形成完整的产业链是一个新现象,但互联网时代数据的爆发式增从当前看,美国大数据产业生态系统不仅长,使得一些新兴的信息技术企业虽然不是数 已经形成,而且企业数量惊人。从长远看,美据的最先利用者,但是毫无疑问开启了大数据 国大数据产业生态系统处于不断变化的过程中,时代的大门,典型代表是盈利模式基于大数据 因此,要对美国大数据产业生态系统做一个准的信息技术企业,如搜索引擎企业谷歌,门户 确的描述是不易的。不过就大数据产业的特性网站企业雅虎,电子商务平台 eBay,在线购物 看,美国大数据产业生态系统划分为纵向的两企业亚马逊,社交网络企业 Facebook、Twitter、 个层次、横向的三个层次,纵横交错形成完整LinkedIn。其次是传统上对数据管理极为依赖 的大数据产业链。从纵向看,处于底层的是一的企业,典型代表是华尔街的金融企业。一些 些开源项目,大数据产业底层的核心技术都是大型金融企业在数据基础设施上投资力度之大, 开源项目。建立在开源项目基础之上的则是基已使得自身与信息技术企业无异,金融数据正 础架构、证析和应用。

从横向看,依次是基础在成为金融企业的起点。第三是大数据应用潜 架构、证析和应用,其中,运用建立在数据源力巨大的企业。典型代表是电信行业和医疗卫 基础之上,而一些大型信息技术企业横跨基础生行业。第四是数据驱动型企业越来越多,这 架构和证析两个领域。开源项目、基础架构、些企业正在形成数据驱动文化,即利用数据的 证析、应用、数据源每个领域都可进一步细分采集和证析来改善运营效率和决策水平,其典 为若干个子领域。从美国大数据企业数量分布型代表是美国航空、百货、能源和汽车企业。 看,有如下特点 :一是开源项目企业数量较多,联邦政府高度重视 表明美国大数据产业基础技术多元化。其次,大数据在美国企业中的广泛应用引起美 美国大数据企业主要分布在基础架构和证析两国政府和学术界的高度关注,美国政府高度 大领域,表明美国大数据产业基础技术已经成重视大数据,这是因为,大数据与联邦政府 熟,目前产业重心已经上移。三是应用和数据职能息息相关,主要体现为两个方面 :一是 源两个领域的企业数量不多,表明美国大数据国家安全,二是科学研究。前者源自网络威胁, 产业还有成长的空间。后者则源自 1998 年图灵奖得主、微软科学家应用拉动产业发展吉姆·格雷 2007 年所做的科学研究第四范式市场对大数据的旺盛需求是拉动美国大的著名演讲,他在演讲中首次提出科学研究已 数据产业发展的一个重要动力,从市场蔓延的经进入第四范式,即人类的科学研究已经历 趋势看,美国大数据产业的需求主要来自以下了经验、理论、计算三个科学研究范式,目 方面 :首先是一些信息技术企业,尤其是后起前已经进入第四范式——数据探索。

美国总 的信息技术企业。数据利用和分析在美国并不统科技顾问委员会基于上述两个方面的考虑,2013 年5 月号总第204 期 55 COVER STORY 封面专题2011 年建议奥巴马总统建立专项计划推进国发展规划》。2012 年 9 月,科技部发布《中国家安全和科学研究领域的大数据建设。2012云科技发展“十二五”专项规划》,工信部也正年 3 月 29 日,奥巴马政府发布“大数据的研在制定《云计算产业战略规划》。地方层面,在究和发展计划”,旨在加强政府和学术界的大国家层面的带动下,各地纷纷出台云计算产业数据应用能力,最终目的是加强大数据时代发展规划和物联网产业发展规划。而对大数据的国家安全和科学研究能力。产业,不仅国家层面没有专门的产业规划,在融入教育和科研地方层面,目前我国没有一个省市对大数据进美国大学目前对大数据有很高的热情,大行产业规划和布局,即便是发展大数据产业条数据成为美国大学很多学科关注的焦点,主要件最为有利的北京,在《中关村战略性新兴产表现为 :一是大学计算机学科为大数据产业界业 集 群 创 新 引 领 工 程(2013—2015 年 )》 中,输送和培养数据科学家。数据科学家被誉为 21


本文由转载于互联网,如有侵权请联系删除!