为什么良好的数据治理如此重要?考虑一下没有它可能会导致什么:数据质量差,难以使用,缺乏完整性,容易受到网络安全的威胁,不一致且业务用户并不总是可用的数据。
换句话说,从业务角度来看,没有数据治理就没有数据存在的意义。
数据治理研究所是一个在该领域提供最佳实践和指导的组织,它给出的定义是,“数据治理是一个信息相关流程的决策和问责系统,根据商定的模型执行,这些模型描述了谁可以用什么信息采取什么行动,以及在何时、什么情况下使用什么方法。”
许多组织正在进行的数字化转型也将使强大的数据治理对企业来说变的更加重要,因为企业的成功在很大程度上就取决于数据的可靠性、安全性以及能否在正确的时间提供给正确的人。
毫不奇怪,对数据治理产品和服务的需求正在上升。研究公司Markets and Markets估计,全球数据治理市场将从2020年的21亿美元增长到2025年的57亿美元,在预测期间的复合年增长率(CAGR)为22%。
报告称,数据量的快速增长、监管和合规要求的提高以及业务合作的增加等因素预计也将推动市场的增长。报告称,随着世界各地的政府机构制定了一系列的数据隐私条例,确保组织内的数据能够得到适当的存储、使用和丢弃变得比以往任何时候都更为重要了。
该公司表示,影响数据治理需求增长的另一个因素是软件开发越来越多地采用了DevOps。报告指出,DevOps的采用与数据治理计划的实施之间存在着很强的相关性。
通过遵循一些最佳实践,组织将可以创建有效的数据治理计划。
识别关键数据元素并将数据视为战略资源
但并非所有的数据对组织都具有同等的重要性,良好的数据治理的一部分就是了解数据基础结构的哪些方面才对业务来说最为关键。
“纵观整个领域,你会发现这些关键元素会涉及数十到数百个的系统和应用程序,”新泽西州司法部首席信息官Jack McCarthy表示。这些关键数据元素可以在整个系统的多个报告中被找到。通过首先确定这些关键要素,你将能够追踪它们的来源,并确定适用的政策和程序。
在更基础的层面上,组织需要掌握信息对业务成功的重要性。这有助于创建一种支持强大数据治理的文化,包括在组织的最高级别。
“我的经验是,数据治理的有效性源于企业愿意并能够将数据作为一项关键的战略资产来接受,”宾夕法尼亚印第安纳大学的首席信息官Bill Balint说。
“将原始数据转化为能够产生积极结果的信息不能被视为是事后诸葛亮,”Balint说。
为整个数据生命周期设置策略和程序
数据不存在于单个的时间点。它是由一个数据源创建的,并经过了清理、更新、存储、分析、传输、备份、删除等过程。生命周期的每一步都有潜在的接触点,想在各个阶段都管理好数据就需要为每个阶段都准备好策略和程序。
“确定谁是数据的所有者,以及哪些系统或人员可以在数据的整个生命周期中更改数据,”McCarthy说。通过这种方式,组织将可以提供审计跟踪和其他的数据检查点,以确保对数据元素的全面彻底了解,他补充说。
同时也需要政策支持的一个很好的例子是,新泽西州的司法部门正在考虑对该州取消保释的刑事司法改革进行风险评估。
“当我们试图收集数据并确定自动计算评估工具得分所需的关键要素时,我们就会继续深入到逮捕的生命周期,”McCarthy说。“我们发现,在向法院提交搜查令的那一刻,必要的数据并不存在。数据源发生在执法部门完成指纹检查以确定被告身份的早些时候。通过追溯数据来源,我们将能够与内部和外部合作伙伴共同发布指令和政策,以确保我们正在构建的系统的关键元素可供我们以及其他下游合作伙伴使用。”
让业务用户参与治理过程
企业用户通常是良好数据治理的最大受益者,因为它使他们能够拥有高质量、高可用的数据来帮助他们更好地完成工作。如果有意义的话,他们也应该参与到治理过程当中。
“我喜欢和数据所有者或他们的副手来组成一个用户小组,”包装公司Alpha Packaging的高级技术副总裁兼首席信息官Bryan Phillips表示。“然后,我会让他们对正在进行的工作和优先事项进行一定程度的预算控制。”
这有助于各部门之间的合作,促进知识共享,甚至是可以创造一点友好的竞争,Phillips说。“你希望这个群体能够分享成就感。而数据治理如果做得不对,就可能会被视为是一种负面影响,”他补充道。
数据所有者通常也是最适合对其数据进行分类的人,Phillips说。“没有人比他们更了解这些数据了,”他说。“可以使用该组确定问题所在”并解决问题。
不要忽视主数据管理
治理应该还包括管理主数据,即为所有业务事务提供上下文的有关业务的数据。有效的主数据管理可以提高数据的一致性和准确性。
“必须(非常)重视主数据的标准化和交叉引用,”Phillips说。“这往往是最容易被忽视的领域。没有它,数据就会变得孤岛化,跨域数据将无法关联。让主数据组拥有这些数据并与业务用户密切合作是非常重要的。”
理想情况下,负责主数据管理的小组应该是一个跨多个部门的业务职能部门,而不是IT的一部分,Phillips说。
理解信息的价值
数据治理几乎就是一个误称,因为它不一定能够反映从信息中收集见解的真正价值。
“信息是为组织创造价值的数据之间的关联,”医疗咨询公司Impact Advisors的高级顾问兼虚拟首席信息官Marc Johnson表示。其中包括了财务记录、患者记录、员工记录等。
“治理需要的不仅仅是数据分类,”Johnson说。“它也需要信息分类。信息分类表明了信息丢失、被盗或被销毁后对组织的价值和后续影响。“他举了一个例子,一名员工可能会通过电子邮件将信息从公司账户发送到私人账户。
“我们已经做好了数据丢失预防措施,以阻止受保护的健康信息外泄,”Johnson说。“如果我们不采取步骤来对信息(而不仅仅是数据)进行分类,我们就会屏蔽掉一个杂务任务列表。如果我们没有进行额外的尽职调查,就可能会在我们的系统中导致成千上万的误报,从而导致警报疲劳、过多的网络流量以及安全运营中心不必要的高警报状态。”
数据治理需要详细的尽职调查,以了解谁有权访问哪些信息,以及这些信息对组织、客户、员工、合作伙伴以及其他人的价值。
“如果一个组织在数据治理过程中做得不够深入,他们就有可能对业务信息基础的保护、可用性和恢复进行过度的工程设计,或者工程设计不足,”Johnson说。
不要过度限制数据的使用
鉴于信息资源的竞争价值以及重大的安全和隐私风险,IT主管可能倾向于严格限制数据的分发和使用方式。这可能会让治理在组织中看起来更像是一种消极的做法,而不是积极的做法,并最终阻碍创新。
严重的限制“会限制价值创造,抑制商业价值,”保险提供商公共机构雇员全球保险公司(WAEPA)的首席信息官Brandon Jones表示。“这导致了用户对企业技术的不满和缺乏采用。”
WAEPA已经构建了一个综合的、全面的平台,它可将来自不同来源的数据聚合到一个平台上,并利用基于业务利益相关者需求的多种可视化技术,Jones说。目标包括了提高数据的可访问性、准确性和完整性,以支持更有信心的决策。
“组织领导者必须不断适应业务的需要,为做到这一点,每个利益相关者都需要做出贡献,”Jones说。他们还需要能够轻松、安全地访问与其工作相关的信息。
“治理是为了确保正确的问题能够得到解决,以及如何使用数据来为解决这些问题的决策提供信息。”Jones说。