数字经济时代,数据已成为企业的核心资产,而数据质量是开展数据智能化应用的关键,如何通过数据治理提升数据质量,提升数据资产的价值,已经成为各大企业面临的一项重要挑战。
数据质量不是一蹴而就的,应该通过数据的各类应用场景倒逼数据质量的提升。企业网D1Net认为,数据不能单纯停留在存储层面,只有具备一定的应用场景,才能对数据质量提出更高的要求,促进数据质量的提升,二者之间是“以数据质量推进应用,以应用促进数据质量提升”的正向循环。
东航通过数据共享成为数据要素价值实现的赋能者
中国东方航空(以下简称“东航”)是中国民航业内第一家上市公司,也是民航业首批签约加入上海数据交易所的数商,标志着东航以数据作为业务活动的主要生产原料,是数据要素价值实现的赋能者,是产业链数据要素的联结者和服务提供者。
东航于2003年开发了第一个报表系统,2017年启动数据治理工作,得益于东航对信息化发展和数字化转型的高度重视,2021年东航管用结合型的数据治理模式成功入选国资企业标杆模式。
为了进一步探索数据资产价值评估,2021年东航积极参与数据要素市场建设,加快完善公司数据交易管理机制,充分发挥东航海量数据和丰富应用场景的优势,赋能东航产业生态转型升级。
中国东方航空数据治理部总经理刘静莉提到:东航身处民航服务业的行业生态中,必须要与机场、离港系统的支持服务商、地面代理、销售代理等进行多方联动,东航每年要与上百家单位进行数据共享,保障旅客的出行服务。
以航班链数据为例,为了保障航班运行,东航梳理了包括机组排班、航前飞行准备(清洁、加油、餐食配置)、起飞、空中飞行的实时布控、降落、摆渡车到位等26个保障节点。
东航在上海的两大机场可以通过自有实力保障航班各节点的运行,而在一些小机场东航员工数量较少,需要与机场的地面代理公司合作,共同完成这些节点的保障工作,此时就牵扯到了与机场进行数据共享的问题。
数据共享和流通给数据质量提出了更高要求
数据共享的目的是为了保障东航航班在当地机场的各个保障节点能够按计划进行,对于未按计划进行的节点需要及时进行相应的人工干预。对于机场而言,需要将每一个航班的航班链信息补充完整,通过数据进行各航班节点的资源配置。
据悉,东航已经实现与40多家千万级机场之间进行数据共享,通过在上海数据交易所挂牌的形式,向机场输出数据产品,帮助机场和航司打造完整的航班链,有效提升航班保障效率和旅客服务体验。
而这些数据能力的背后都离不开数据质量方面的治理工作。如果没有前期的数据质量作为基础,任何数据应用的价值实现都将成为空中楼阁,因此良好的数据质量基础是数据应用产品非常核心的前置条件。
实际上,机场作为保障单位,对数据质量的要求非常高。
首先是数据的完整性,要确保每个航班的每一个节点都能发送相应的数据。
其次是数据的及时性,航班的保障时间向来争分夺秒,必须在航班保障节点发生时能够实时将数据发送出去。
第三是数据的准确性,由于节点较多,可能因为人工采集和填报的过程中出现问题,导致数据保障节点前后发生错误,为了提高数据的准确性,东航通过数据监控实时了解数据质量情况,通过与机场在数据标准、定义以及考核口径等方面达成一致,确保数据在生产过程中的准确性。
数字机坪 打造枢纽港精细化地面服务管理能力
以摆渡车的数据为例,过去往往需要地面的服务保障人员对摆渡车的数据进行人工采集,如今,民航业的采集手段正在逐渐进化,通过自动化的方式实现数据的精准采集。以深圳机场为例,位于机位的摄像头支持自动化视频采集,可以通过AI识别捕捉车辆形态,进而分析出驶来的车辆是摆渡车还是加油车,为哪一个航班提供保障服务等。
在摆渡车的联网化方面,东航正在通过数字机坪项目与机场进行共同探索,以车辆加装GPS设备的方式进行数据共享。由于牵扯到各大机场的统一规划,数字机坪项目仍然面临一些待解问题,例如航空公司的数据如何与机场进行统一连接,机场设备中的数据如何发送到航空公司等。
据悉,智慧民航和智慧机坪是民航业未来规划的重要突破点。近年来,东航积极推进机坪运行数字化转型,探索建立与机坪实际运行场景“数字孪生”的“数字机坪”,打造枢纽港精细化地面服务管理能力。东航“数字机坪”项目于2018年启动,截至目前,“数字机坪”在东航机坪生产运行管理中,已经覆盖97%的任务分配和超过70%的工时利用。
东航通过明确管控场景画像,探索数字孪生可视化监控:针对员工、飞机、车辆、设备,构建物联网平台,实现实时定位与感知;依托移动应用,对航班保障节点建立动态反馈机制,实现对航班任务的动态画像;整合集成东航内、外部保障单位运行保障数据,在机坪建立跨单位的系统生态和生产数据链,实现“每个环节有跟踪,每个行为有记录”的运行全景可视化。
数据显示,通过数字化转型后的班组排班优化,东航机坪作业人员的人均保障旅客增加了8.1%,但疲劳度却得到纾解,优化之下东航地面服务关键岗位的年度流失人数较之“数字机坪”改革落地前,已经大幅下降33.56%。
基于互信互惠、共建共治共享的理念进行数据共享合作
近年来,各大机场都在加强信息化以及数字化方面的投入力度,采取相应措施提高数据的准确性和及时性。东航与机场展开数据共享,是希望能够在第一时间拿到机场的数据,能够有效破解由于人工记录带来的数据不准确、不及时的问题。
刘静莉强调:东航本着互信互惠、共建共治共享的理念与各方开展相应的合作,从数据质量方面进行调研,通过事后分析共同解决其中存在的数据质量问题。
在东航的数据采集端,由于数据质量问题,可能导致航班延误时未能及时通知旅客的情况发生,遭到旅客投诉。分析背后的原因,有些问题是由于代理人在购票的过程中,未能将采集到的旅客数据以及真实的联系方式转发给航司带来的问题。
刘静莉提到,这类数据质量问题是东航数据治理的重点,一方面,东航通过下达管理要求,以一定的处罚机制提升数据质量,另一方面,通过直销渠道在旅客服务的30多个触点与旅客进行相应的互动,来确保旅客能够及时准确地了解航班变化,从而为旅客提供更加优质的出行服务,提升出行体验。
结合数据在不同阶段的特性 进行数据质量管控
埃森哲技术创新事业部首席数据架构师王兵认为,数据的流通和共享场景正在不断深化的过程当中,基于数据的合规监管和共享应用也在不断增强。
以吉林电力为例,目前正在推进数据在线服务平台建设,涉及综合能源应用场景的监测、热度分析、质量分析以及整体运营监控等。这与以往的对内服务能力不同,更强调对外的数据共享和流通,必然涉及到数据隐私保护、公共政策的合规与脱敏以及权限使用方面的问题。
王兵强调,企业的数据质量管理应贯穿数据生命周期的整个闭环,覆盖数据采集、数据汇聚、数据问题诊断、数据清洗、优化完善等各个方面。需要结合数据在不同阶段的特性,进行数据质量管控。
例如,在数据采集部分,工业环境下的数据交换涉及设备数据、产品数据、IoT数据等,在数据采集的源头要重点校验数据的完整性和准确定。
在整合与汇聚层面,不同行业的具体情况不同,以石油工业的数据整合为例,会重点考虑产品数据库、工业数据库以及供应链数据库中数据质量的一致性和规范性。
在数据加工处理和转换的过程当中要进行数据质量的全面追踪,例如基于仿真测试的流程分析、运营分析、诊断预测以及上层决策和控制等方面,更注重数据的应用效果,对数据的有效性和及时性有着更高的质量要求。