CIO需权衡AI改善数据管理发挥的作用

CIOAge 人工智能
从电子商务到非营利组织,利用企业数据资产可能是组织成败的关键。机器学习和生成式AI是其中的一个组成部分,但要成功地应用这些技术则评估AI对业务的实际影响。

从电子商务到非营利组织,利用企业数据资产可能是组织成败的关键。机器学习和生成式AI是其中的一个组成部分,但要成功地应用这些技术则评估AI对业务的实际影响。

AI已经成为一种企业口号,机器学习和生成式AI也成了讨论的话题之一,特别是CIO的角色必须做出相应调整,总部位于阿姆斯特丹的国际电器零售协会Euronics就是其中一个例子。Euronics数字总监Umberto Tesoro的工作,就是从更好地利用数字数据来创造更好的客户体验和增加销售额开始的。

市场分析公司Gartner建议,将数据和分析策略扩展到包含AI,并避免没有治理的碎片化举措。在实践中,生成式AI是Euronics涉及数据和分析战略的一个特例,而指导这一战略的人(CIO或CDO),其任务就是知道什么时候应用生成式AI,什么时候不应用。

事实上,生成式AI目前并不在Euronics实施的技术之列,因为Tesoro认为生成式AI并没有适用于零售活动的用例。“IT必须为业务服务,”他说。

经理团队的第一步,就是聘请一名UX设计师,这位设计师不仅要为最终用户设计界面和体验,还要进行测试,以提供有关网站和应用性能的定性及定量证据来指导业务。

Tesoro说:“电子商务就是关于从访问网站到完成购买的整个旅程,我们会监控整个流程,使用汇总数据来评估为客户带来的最佳解决方案和体验。我们始终向消费者提供两种不同的体验并评估结果。然后,我们选择其中一种,对网站体验进行改善,因此我们的电子商务策略完全是由数据驱动的。”

网站解决方案通过机器学习得到了增强,这种方案通过建议展示与客户已购买产品一致的相关产品来帮助提供个性化的内容。至于机器学习和分析,Tesoro会在市场上购买最好的产品,然后通过技术合作伙伴根据公司网站和应用需求定制应用。

“内部IT团队必须能够管理和指导供应商,但我们自己是不进行内部开发的,我认为,对我们来说内部开始是很不方便的。我向供应商和合作伙伴提供方向和策略,内部项目经理充当纽带。对我们来说,数字团队的关键人物是用户体验设计师和业务分析师,因为在内部,我们致力于实现的战略目标是:客户体验和通过数据分析支持销售。”

这就是Euronics公司数据资产的价值体现,其目标是为了持续不断地改善客户体验,这促成了Euronics公司前不久与商业媒体公司Criteo之间的合作,即在Euronics的电子商务网站上实施Criteo的零售媒体解决方案。

“我们为消费者提供网站上符合特定搜索的产品,这对我们来说有很多好处:我们为广告商提供了更好的结果,并为在我们的电子商务平台上销售某种产品创造了条件。由于采用了Criteo平台提供的消费者搜索意图数据分析,我们对销售产生了积极的影响。”

非营利组织中数据的价值

即使对于意大利非政府组织Emergency来说,数据也是需要增强和保护的战略资产。

首席信息官Manuele Macario表示:“数据是医院核心活动的支柱,对于我们治疗的患者来说,数据必须始终是安全的。”

这一理念促使Emergency启用了一种信息系统,该系统通过SDC软件平台管理阿富汗三个急救外科中心的临床数据。Emergency系统的架构是基于开源组件的,分布在各个急救诊所的服务器和平板电脑上。

Macario表示:“这个开源软件平台是由我们的医疗部门创建的,即使在不稳定的条件下也能记录数据,例如,它可以适应于没有互联网连接和离线工作的情况。当线路可用时,数据会重新传输。而且它易于安装,可以将其传输到其他站点。”

但这并不影响它是一个非常先进的临床数据收集系统的事实,因为该平台是数字化的、实时的、安全的,因为数据在VPN上加密并发送到Emergency位于米兰的中央数据中心。在这里,还会通过微软Power BI进行分析。Macario解释说,基础设施是在本地部署的,用于保护现有的投资,但不排除云。事实上,近年来Emergency已经采取了措施将一些服务迁移到云上。

Macario说:“数据管理中最重要的,就是要有一个可靠的灾难恢复计划。事实上,对于像我们这样的非政府组织来说,安全既是网络问题,也是物理问题,因为我们不仅是攻击的目标,而且我们在战区运营,所提供的服务并不总是可靠的,而且一旦发生故障,很难找到替换的部件。”

他们还采用了创新的加密和地理数据备份技术,特别是可以防止勒索软件的不可变云技术。这些技术由AI提供支持,用于端点保护。用户身份是在Azure Entra ID平台上进行管理的,该平台集成了AI并提供对可疑活动的实时警报。

数据管理的转折点

但是在紧急情况下使用AI所带来的真正变化,是在阿富汗开展的Amanat项目中应用的生成式AI。该计划源自于八年前Emergency扫描了超过1000万张医疗记录的工作。

该项目的下一步,是使用数字化数据并对其进行分析。事实上,扫描的数据无法被软件读取,因为是从一家从事创伤手术的医院的文件中提取的,因此通常是匆忙书写的,笔迹不准确且潦草。

“我们求助于大型技术公司来解决这个问题,而大型语言模型算法带来了转折点,这种模型让我们能够进行分析,我们的医疗部门使用这些算法来分析获得护理的机会并提高质量,获取统计数据,创建档案,并了解在战争环境中我们需要哪些仪器、药物和医生。这些数据为我们开展干预和报告战争对平民的影响提供了科学依据。”

Macario的团队随后启动了PoC,从2002年至2018年期间随机抽取了喀布尔创伤医院的一千份医疗记录。PoC是测试该技术功能和控制成本所必需的,如果将系统应用于所有文档,成本会大幅增加。

“我们选择微软和Azure OpenAI技术作为合作伙伴,我们不想将医疗记录数据放在开放的OpenAI-ChatGPT系统上。相反,我们使用了微软租户上的空间,以确保我们患者数据的隐私和保护。”

微软的技术是定制的,提供了计算能力,但急救团队需要定制的Azure文档智能算法,通过对医疗记录中使用的格式进行训练,让AI知道在哪里解释什么信息。

Emergency创建了一个可搜索的关系数据库,从中执行活动的后验分析以捕捉趋势。为了读取数字化的医疗记录,Macario的团队创建了插入Azure OpenAI的特定提示,以获取例如首字母缩略词的解包或仅部分书写的单词解释。

Macario解释说:“我们把从受伤到医院治疗之间的时间信息区分开,这对于了解急救中心的位置以及手术是否有效至关重要。通过正确的提示,我们引导Azure OpenAI纠正和转换此类信息,为我们提供可以在图表上进行分析和可视化的数据。”

对AI进行适当的投资

Macario强调,只有当AI的收益足以证明投资的合理性时,才应该应用AI。

“除了我们组织真正需要的东西之外,我不会考虑使用AI和大型语言模型,否则,从成本和环境负担的角度来看,这是一种不可持续的技术。对我来说,AI和生成式AI应该用于获得无法通过其他方式获得的结果,或者预期会有显著收益的情况下。我们的Amanat项目就是如此,该项目不仅使用AI为运营提供有用的数据,并为在战争背景下更好地应对未来干预做好准备,能够通过数据判断战争的后果。”

Euronics的Tesoro对AI也很挑剔,因为该公司目前没有将其应用于零售活动,但Euronics正在Salesforce生态系统中进行测试,以了解AI在提高生产力方面的潜在用途,前景似乎是十分光明的。

“我认为,目前AI不会对我们的业务产生重大影响,但我对手动流程的自动化很感兴趣,我们已经测试了一些生产力工具,这些工具带有生成式AI功能用于执行重复性、非价值性的任务。对我来说,AI是一种赋予人们权力的工具,使人们不会将自己的才能浪费在机械任务上,而是转向那些可以发挥他们智力的任务。”

Macario重申,在Emergency的Amanat项目中,ChatGPT的任务是被严格限制的。“它是一种工具,而不是一个预言,必须给它设定界限,明确指示它必须做什么,算法通过统计数据说话。它们不会给出正确或错误的答案,而是一个或多或少具有高可靠性的答案。但同时,低于某个阈值的答案是不可接受的。在PoC中输入的数千条记录中,我们丢弃了一半不可靠的记录。”

不要忘记传统AI

据作家兼数据和分析专家Stefano Gatti称,生成式AI虽然有帮助,但还不够成熟,无法管理面向客户的服务。“相反,正如不少CIO所意识到的,生成式AI已经足够成熟,可以支持内部生产力的提高。在任何情况下,人工监督对结果可靠性的验证来说,仍然是根本。”

Gartner也持类似观点,认为在投资生成式AI之前,CIO们应该首先了解用例是否为企业创造了价值,在实践中是否可行,因为很难证明不加区分地应用生成式AI是否合理。还有一些成熟的或传统的AI技术,如优化、模拟和知识图谱,在没有生成式AI的情况下也可以发挥作用,而且这些技术的风险更小一些。

责任编辑:庞桂玉 来源: 至顶网
相关推荐

2024-10-09 14:14:44

2024-06-07 06:37:34

2010-04-19 15:41:58

2022-04-07 20:26:45

数据管理自动化

2024-10-23 15:35:08

2018-05-23 13:47:24

数据数据管理可视化

2010-04-22 18:00:33

Oracle数据库

2022-03-28 13:25:51

AI数据中心耗电量

2021-05-10 10:04:15

区块链公共部门数据管理

2024-03-20 06:55:04

AI技术CIOGenAI

2020-06-05 14:48:35

数据中心数据管理网络

2013-08-12 10:19:27

大数据分析架构大数据分析

2024-09-30 08:13:58

AI数据管理平台人工智能

2024-03-25 10:32:57

2022-11-21 18:00:26

GraphQLAPI开发

2023-08-31 16:10:43

数据中心人工智能

2022-03-29 06:48:59

CIO环境可持续性IT领导者

2024-09-13 17:16:48

2023-06-01 11:42:53

大模型人工智能

51CTO技术栈公众号