连广宇认为,首先,改变了企业决策的传统模式,由经验驱动决策向数据驱动决策转变。第二,大数据提升了企业的业务质量和业务能力。第三,借助大数据和AI赋能,实现机器换人、减员增效。第四,大数据推动跨界融合及新业态的产生。
大数据与AI技术促进了产业的整合互通、资源的跨界对接,未来的数据流动会越来越频繁,资源对接也会越来越频繁,可以讲,大数据改变了传统的产业资源配置方式,使得社会整体效率得以提升。
大数据技术给产业带来的影响和改变是非常显著的。但同时,制约大数据在实体产业中应用的因素也很多。
首先是数据获取和质量问题,数据缺失、数据获次、数据孤岛、数据质量等带来的应用障碍普遍存在,不仅在开放领域大数据缺乏公开共享机制,甚至在企业内部也存在业务数据的条块分隔、难以集成应用的问题,这也是企业数字化转型过程中首先要解决的问题。
其次是大数据安全和个人隐私泄露问题,目前有很多由于数据安全和个人隐私泄露引发的负面案例,已经引起业界的高度重视。从技术角度看,需要采取更为强大的数据安全措施,研发新的加密算法和加密体制,但由于分析技术的日益强大,采用脱敏技术也无法避免隐私信息的泄露问题。从社会管理角度,相应的政策法规也在积极制定中。
再次,大数据交易目前还存在诸多灰色地带,数据归属权确认和交易机制的建立亟待解决。大数据目前掌握在少数企业和部门手中,一定程度上形成了新的商业垄断,不利于大数据应用的良性发展。
最后,大数据的利用技术也在不断发展中,不断变化的应用场景需要更多包括AI技术在内的大数据分析技术的支撑。这也引申出大数据技术人才特别是高端技术人才的缺乏问题。
大数据安全是一个持续性课题
雅乐美森为客户提供海量文本大数据的分析服务,数据源包括互联网数据、客户数据以及部分第三方数据。客户提供的业务数据中往往带有敏感信息,而第三方数据的使用也会有使用权限约束与安全性条款。
连广宇表示,目前他们的安全保障主要是三个途径,一是平台安全措施,加强权限控制与安全审计,防止内部窃取和外部攻击;二是采用特定的数据脱敏和匿名化技术;三是实施严格的数据管理制度,严防各环节的人为数据泄露和数据篡改。安全体系建设是个长期过程,雅乐美森十分重视安全技术,不断提升数据安全体系建设。
AI领域商业化发展空间巨大,围绕人工智能的数据安全问题也一直是公众关注的焦点。连广宇认为,AI与大数据紧密关联,大数据系统分布式的系统部署、开放的网络环境、复杂的数据应用、众多用户访问,都使得大数据系统的保密性、完整性、可用性面临挑战。
首先,目前大数据平台安全方面存在多方面问题,主流的基于Hadoop生态的系统架构缺乏原生安全特性或安全性不足;大量使用未经安全测试的第三方开源组件增加了数据安全隐患(如NoSQL数据库的安全性问题);一般的大数据应用系统由于用户规模巨大,进行用户身份鉴别、访问控制、安全审计和追踪非常困难。
其次,个人信息(或企业敏感信息)泄露风险巨大。个人或企业信息泄露带来的社会影响比一般数据信息泄露更为严重,这是目前制约大数据深化应用最紧要的问题。目前采用的技术主要是数据脱敏、匿名化处理,配合同态加密算法、完整性校验、密文搜索等密码技术,但即使如此,随着数据分析能力的不断提升,利用大数据挖掘仍可以分析出被隐藏的个人信息,如何解决这一问题显然需要更加深入的探索。
另外,有关大数据归属权、交易机制、安全措施的法律法规、技术框架和标准、检测认证标准等体制机制亟待尽快建立。只有法律、政策、商业、技术等环境越来越健康,大数据应用才会大规模地、快速地发展起来。
雅乐美森科技是行业大数据应用的实践者和探索者,大数据安全问题是项目交付和产品部署过程中绕不开的问题,他们始终遵循“客户至上、安全第一”的项目和产品设计原则,并结合客户行业性质及数据安全等级,在技术措施方面不断创新,形成了具有行业特色的大数据产品安全体系。
在解决数据安全问题上,连广宇认为,大数据安全保护体系的建设是一个系统性工作,安全体系的设计务必兼顾采集、传输、存储、访问、使用、销毁等各个环节,缺一不可。同时,大数据安全体系建设也是一个不断迭代升级的动态过程,不可能一蹴而就,需要持续关注行业规范、技术框架、最新加密算法、先进行业案例等各方面的最新进展并加以合理吸收利用,不断提升自身安全体系的健壮性。另外,结合客户行业特性来创新安全体系设计,也应该成为行业大数据安全体系建设的重要考虑因素。