数据治理是一种数据管理的概念,确保组织能在数据的全生命周期中具有高质量的数据质量能力,并且实现对数据的完全管理,以支持业务的目标。
在字节跳动内部,DataLeap数据平台数据治理团队致力于建立一站式、全链路的数据治理解决方案平台。
在这里面有些关键词:在一些组织、一些公司内部关注的是数据全生命周期,希望它有一个较高的质量,目标则是用来支持业务。
所以数据治理的目标主要由以下几点构成:
第一,最大化数据价值。
第二,管理数据的风险。
第三,降低数据的成本。
数据治理是一个比较大的概念。它包括政策、规则、组织结构、治理过程,以及一些技术的支持。领域包括数据质量、数据成本、数据可用性以及数据安全等方面。
在字节跳动内部,作为统一的数据治理平台方,我们的目标是:“建立一站式、全链路的数据治理解决方案平台”,DataLeap治理平台肩负了四个使命:
第一,让数据价值最大化。这里面包括全生命周期数据质量的保障,既要做到高价值,又能实现低成本。
第二,提供全链路解决方案。数据治理在实际过程中会由多个不同角色共同参与,包括了管理者视角和执行者视角。我们希望不同的角色在我们的平台里,都能够运用一些工具、手段来推进治理的执行。
第三,工具和方法论的结合。字节跳动内部数据治理平台的建设是以方法论来引导建设,希望工具能够提供非常完备的治理能力。
第四,提供增强型的治理能力。在系统的能力上可以主动发现一些隐患问题,做一些推荐或者建议的策略来提升治理效率。
因此在整个数据治理的流程中,遵循如下几个步骤:
第一:我有什么?比如我的计算任务,资产的存储,质量的一些规则,SLA的承诺或者一些异常报警,哪些是属于我的。
第二,清晰知晓治理目标。要知道我要去治理什么,从哪些开始下手,哪些资产是有问题的,我的一些规则是否是设置的合理的。
第三,怎么治理。比如在面临一个具体的治理问题,别人是如何治理的,他们是不是有一些相关的经验可以借鉴;在具体的实施过程里,如何去提效治理。
第四,衡量治理效果。也就是我们的治理是否达到了一些目标,或者获得了哪些收益。
最后,总结与复盘。做完了整个治理链路流程之后的总结,如经验总结、问题归纳等等。