CMA研究:人工智能助力数据治理
文章来源:CMA官微
发布时间:2019-12-06 10:34
阅读:2232次

数据质量是有效运用人工智能最重要的条件,因此,对于运用人工智能进行日常运营和协助开展分析的组织来说,数据治理是非常必要的。然而,数据治理自身又是如何运行和进行分析的呢?数据治理是一项业务职能,如同财务、供应链或市场营销等业务职能,而且在很大程度上也可以如这些业务职能一样受益于人工智能。
小企业可以和大企业一样从人工智能中受益。大企业设有专人从事数据治理工作,小企业则是由身兼其他职责的数据和技术专员提供支持,多个团队共同负责此项工作。
何为人工智能
因为“人工智能效应”的影响,我们很难举出实例来说明人工智能如何助力数据治理。所谓“人工智能效应”,是指一项曾被视为人工智能的成果,不再被视为人工智能。换言之,一旦某项人工智能技术被广泛应用或融合,便不再被特别看作人工智能或其他智能。
这一效应让我们不必太担心不断演变的人工智能的定义。相反,我们将把人工智能作为增强人类智能的途径,并运用计算机程序制定基本决策,进而探讨如何使用人工智能来协助我们开展数据治理工作。
谁受益于人工智能
尽管人工智能范围不断拓展,但数据治理和政策制定工作常常由人执行,人工智能仅提供协助。在负责数据治理工作的人员当中,首先获益于人工智能的是数据管理员(或数据域管理员)。他们通常负责确定数据最佳实践及数据集。
其次是数据保管员(或数据治理工程师)。他们通常负责数据治理功能方面的工作,如数据连接、数据转换和数据访问安全。从业务角度看,他们负责的是数据安全和合规性评估工作。
最后是负责实施组织数据治理项目的部门负责人。部门负责人通常会组成一个数据治理委员会,此委员会必须掌握与数据质量和安全相关的所有活动,如安全漏洞、失败的数据处理、数据处理时间、计算错误、重复营销、违规拨打骚扰广告电话以及发货错误等。
如何运用人工智能?
一直以来,只有大型组织才可能成功地进行数据治理。鉴于数据治理相关工作的繁重和复杂性,这不足为奇。但随着人工智能不断提高人力能力,小企业一样可以受益于数据治理。
人工智能正在使数据治理民主化。例如,流程挖掘或自动化流程发掘(automated process discovery)使用人工智能检查数据处理过程中创建的用户行为数据,行为数据得以向数字记录转化。
人工智能可以判断哪些流程可能更高效,哪些流程可能存在漏洞。在人工智能协助下,数据管理员能够更好地确定哪些是最佳实践,哪些实践有待改进。
确定数据集
向数据仓库或数据湖里添加新数据是有成本的。新数据有标准、规则、定义等方面的要求,添加进去后同样需要维护和更新。人工智能数据发掘(或自动化数据发掘)借助自动化流程查阅内外部数据集,并评估这些数据集是否与组织的目标绩效指标相关。
举例来说,一个组织可能拥有几个社交媒体账号、数十个可在线评论的网站、一个内部客户数据库、电话呼叫中心日志、生产规范、员工内部往来电子邮件,以及包括行业信心、失业率、通胀率、区域人口统计等的外部数据。这些因素可能会影响组织的销售率、销货成本、人才获取成本、员工盗窃率等。
要进行有效的数据治理,就需要了解向运行环境中添加新数据的成本与收益。但是,如果我们尚未将指定的数据集添加到运行环境中,又如何确定它的价值?因为人工智能能够探查任何内外部数据集,并评估这些数据是否与业务绩效指标相关,故而能帮助我们判断哪些数据集会更积极地影响决策。这使得数据管理员能优先评估数据集。
对相关方的影响
确定如何评估数据治理绩效及合规性的难度,不亚于最初实施数据治理。发货错误率或界定数据元素百分比等指标可能易于确认,但确认业务绩效指标似乎更困难。
绩效指标更侧重于创造收益和/或节约成本。数据治理可能会减少客服电话呼叫时间或提高营销效率,但在传统报告中,这二者——数据治理合规性的提升与合规性对整体业务绩效的相关影响——的直接关系很难单独体现出来。
通过人工智能辅助报告,数据治理合规性指标与业务绩效指标可以进行持续比较,还能确认其中的复杂关系,并传递给负责数据治理绩效的利益相关者。
即使是简单的指标,随着时间推移,在多项指标之间与同一指标中也可能呈现复杂的模式。专注于模式识别和自然语言生成的人工智能能够识别这些复杂的模式,并以简单的文本格式来说明某个模式的意义(或至少是模式的存在),后者可作为摘要文本包含在向利益相关者提交的报告中。
在当今数据驱动的经济中,高质量的数据可以带来竞争优势。借助高质量数据,数据解决方案能够降低成本,预测性分析则能够更好地响应客户需求。数据治理是企业保存和维护高质量数据的方式,如果无此职能,小企业将无法与具备数据治理能力的大企业竞争。
不论企业规模大小,数据治理都绝非易事,但有了人工智能助力,诸如最佳实践确定、数据集识别、运营报告等数据治理活动在没有专职员工的参与下也可以进行,这令小企业能够获得之前为大企业所独享的数据质量竞争优势。
Daniel Smith,CMA,TheoryLaneCloud Integration Solutions创始人,IMA技术解决方案和实践委员会成员及IMA达拉斯沃斯堡地区分会成员。
CMA考下来多少钱,一键算出来!
2022年CMA最新资料包领取
请大家认真填写以下信息,获取2025年CMA学习资料包,会以网盘链接的形式给到大家,点击免费领取后请尽快保存。
*姓名不能为空
*手机号错误
*验证码错误

Brian Peng

8年教龄,英汉口译专业硕士毕业,英语专业八级,国家人社部二级口笔译证书 前啄木鸟教育深圳分公司钻石金牌导师,教学主管;数百场国际会议同声传译和交替传译经历,曾服务于各大政府机关,沃尔玛,美国中小学校长协会,第45届世界体操锦标赛组委会,中国-东盟博览会组委会,海外高校,多国驻广州大使馆等。
