[[210222]]
一次,曾鸣特地找到我,对我说:“品觉,作为阿里 BI(商业智能)部门的老大,你的任务就是努力将 BI 部门消灭掉。”我当时真的蒙了。作为 BI 部门的老大,你要我努力将 BI 部门消灭掉?
后来我才明白,这正是他的战略思考,终局的想法是我们要将数据做得越来越便捷,未来根本不应该有集中式的 BI 部门。
数据应该回归本身,让所有人都可以分析,人人都可以成为数据分析师。不是说没有 BI 部门,而是说未来某天数据分析技能已经被每个业务人员掌握。即便从一个数据分析师的角度看,曾鸣的决定也颇具远见和创造性。
大数据下半场,路在何方
如果我对你说, 2010 年时,阿里的数据化运营也是摸着石头过河,最初的数据分析产品还不到 50 个用户,业务方对数据化管理一点也不感冒,大家可不要感到奇怪。
到了 2015 年,阿里的数据平台用户已经超过 8 000 人。在整个进程中,我们从建立一支精锐的数据分析团队,发展到能开发一个全公司的业务和工程人员都能使用的数据平台。数据战略从数据化运营,转移到了运营数据,并协调不同事业群数据共享、共创及标准化,同时又要保持业务的独立及积极性。
6 年中让我记忆最深刻的事情,是聚划算一个部门的自动化项目。马云要求我们用人工智能和大数据去取代一个近百人的部门,而且业务增长率不能下降,难度可想而知。经过这个项目的锤炼,我一直在思考,数字经济引擎的形态是什么样的,以及如何搭建新科技下的数字经济引擎,也深深感受到,未来每家公司都将是“大数据 + 人工智能”公司,这在未来将不再是一个梦想。
全域大数据时代已经到来
我们应该清楚地认识到, 商业基础正因众多终端带来的全域大数据而发生着改变。 它带来的变革不限于数据本身,还有思考社会和商业模式将如何被改变的全新角度。在全域大数据的大潮之下,每家公司都要重新思考,当互联网的场景从单一的桌面转移到多源、多终端时,不仅会带来丰富的空间维度,还会增加更多从前匪夷所思的新场景所产生的数据。
这么多零散的数据和维度叠加在一起,下一难题就变成了如何保证有效地存储、更新、辨识和连接这些数据,并灵活地使用它们。在我看来,开启“上帝视角”是未来趋势,这无疑是激动人心的。
在数据科学成为炙手可热的话题的两年后,我发现我被企业管理层问得最多的问题是:如何确保有足够多的数据来发展人工智能?需要储备什么样的人才? 我认为,大家都忽略了大数据能力的根源来自连接,而连接的基础是数据的流通和标准化。
以阿里为例,数据打通绝对不是马云一声令下就可以解决的问题。从 2014 年开始,阿里管理层数次要求各业务部门(包括支付宝)无条件地将数据互通,然而换来的终究也只是表面的打通而已。手下人的阳奉阴违也是花招不少。比如,我有数据,但是我不告诉你有什么;就算你知道我有数据,但我不能保证提供给你的是有质量的数据。因为没有业务关联,对方很难长期、义务地配合你,所以就更不会把新增的业务数据和盘托出了。我认为,问题的关键,在于互惠互利。只有你找到真正的痛点,才能将企业数据循环打通。
互惠互利,打通企业数据循环
在这个人工智能蓬勃发展的时代,数据的增量比存量多。多变的业务场景也意味着需要敏捷的数据更新(包括结构)。在你使用数据时,数据本身可能早就出现了定义上的变化, Data broken(数据断裂)指的就是数据已经不能反映当前现实。因此,以这些断裂数据为基础的任何人工智能算法,都会相应地产生偏差。
这种事情表明了什么?所有的数据流通必须建立在一个永恒不变的道理上:互惠互利,否则你无法做到对数据进行适时的修正。 虽然说高层掌握着权力,但要发挥出整体的数据战略,只靠从上而下的命令是不可能的,还必须依靠从下而上的共建共创。只有这样,才能实现合力而成的多源异构大数据。所以我一直强调: 大数据是自利、利他的成品。
在阿里时,我是怎么处理部门间数据互通这件事情的呢?很简单,首先是找出大家有意愿共用的部分,我称其为企业内的公共数据,然后安排资源把这一部分先建设起来。选择公共数据也有一定的技巧,简单归类就是:各部门已经在高频率但低效率的单线流通的数据,被野蛮重复复制到各部门的相同数据,大家都有意愿首先标准化的数据。当这些带有公共性质的核心数据建立起来之后,大家就能更容易地感受到数据高质量流通的意义及好处。要保证这些数据的质量和新鲜度也相对变得容易了。
之后,我采取的是共创共赢策略。我将我们部门所有的、我认为很有可能成为公共数据的数据,全部都放在大家眼前。如果其他部门有人要使用的话,这些数据可谓招之即来。当然,前提是这些资源都是我先开发完的。当他们所有人都开始使用这些数据时,我就可以输出技术及标准,去帮助其他部门完成更大范围的数据打通。
加入支付宝后,我面对的***件事就是着手组建支付宝数据分析师团队。 2010 年的支付宝,大部分业务团队对数据团队都不太满意,而且高层对数据能产生的价值也没有太多认识。同时,由于当时数据负责人调职,导致支付宝的数据分析和数据技术部门被分开管理。
面对数据分析和技术团队的目标不一致,业务部门对为什么要使用数据以及如何善用数据充满疑问,甚至有人认为数据分析仅是门面功夫。但我坚持数据分析产品化路线,相信数据分析的工作最终必须落地在产品上。
从解放集中式的数据分析师团队到“人人都是分析师”的泛化过程中,我们的业务部门自己就可以便捷地使用工具解决问题。经过一年多的努力,有一天 CEO (彭蕾)走到我办公室对我说:“你知道吗?你们做的产品让我觉得很爽,我很喜欢这个产品。”看到同事和老板对产品的支持,让我肯定自己在支付宝走的这条路是正确的。如果让我总结这其中的精髓,我的秘诀是: 数据分析也要讲究用户体验。
运营自动化,是大势所趋
当我 2010 年进入阿里时,我们的数据团队会利用数据去做好报告,以支持业务部门,让业务部门可以更好地把握其业务。数据团队继而在 2012 年开发了很多数据产品,将重复的业务分析需求产品化,把数据能力泛化到一线团队。
几年间,大数据距离成为业务的核心就仅差一步。直到谷歌的无人驾驶汽车项目出现,我忽然如梦初醒,这不就是业务与数据的无缝对接吗?
问题来了:商业运营的过程能像无人驾驶汽车一样实现全面的自动化吗?
2014 年,我接了一个任务,即把阿里某团购业务的运营从几十个人的团队完全转变为自动化(去人化),这项工作需要大量数据、多种算法及 IT 系统的有机结合。在这个过程中,我们要把已知工作流程中的人为决策,转化为数据驱动的自动化决策(我们称其为数字经济引擎)。而决策之间的权衡也是一种算法,决策本身就是一场博弈,越大的场景运营起来毫无疑问就越复杂。后来这个项目按计划完成了,但实际上棘手的问题并未真正解决。
在这个过程中,我们更体验到智能 / 自动化所要求的数据质量更高,数据不足的情况更明显,尤其是外部数据(包括竞争环境)的稀缺更非靠我们一己之力能在短期内解决的。
另外,数据商业引擎的***原则是,人为干预越少,数据回流越顺畅。最终,这个项目其实是在妥协中结束的。
最近受阿里前同事的盛情邀请,让我有机会回杭州看一个智能客服的项目,即用客服机器人取代人工客服。刚一落座,我就问道:“机器人还有多长时间可以完全取代人类?”我很期待作为人工智能应用一线负责人的答案,他明确地表示“5 年”。
他提到,让客服机器人独立运作前,首先要做的是恶补客服机器人在没有足够数据的情况下的一些智识盲点。短期的改善方法是,他们设置了一个叫“人工智能培训师”的新岗位,帮助解决客服机器人数据不足的问题。借用人工智能“大牛”、香港科技大学杨强教授的观点,客服机器人的好坏,关键在于有没有高质量的数据。令人兴奋的是,目前客服机器人(非语音)已经能自动应对 85% 的客户访问了。
***,我想分享,阿里在数据化实践过程中有三大原则:
相信数据是未来所有业务的核心竞争力。
不在线的数据,不是大数据。
数据的有效使用与高度流通要有互惠互利机制。
只有真正做到这三点,才能让大数据真正成为企业增长的杀手锏。