低调了一年的微软小冰,突然放了个大招——它能写诗了,不仅如此,还有财经评论。当你随机上传一张图片,小冰可以根据图片内容瞬时创作一首诗歌作品。
这并不仅是一项功能上的拓展,它意味着人工智能不仅能涉足制造领域,还能进行自我创造。根据微软亚洲互联网工程院副院长及小冰项目负责人李笛介绍,小冰的创造并非是基于模版,在人类已有作品上的简单叠加,和表面性的模仿,而是具备独创性,能够真正形成人工智能的知识产权。如果结合人工智能高并发的特性,这项能力将使大规模的AI内容生产具备可能性。
那么AI的创作过程是如何发生的?
人类创作的过程,分为四个步骤:诱发源(灵感的来源,信号足够充足)——创作本体(本体的知识被诱发)——创作过程(最大的黑盒子独立于诱发源)——创作成果(与诱发源相关,仅此而已)。
李笛举了个例子,曹植以豆子为主题写《七步诗》,信号非常弱,在创作过程中添加了他和曹操的因缘情仇这类本体的经验和故事,从而引发了创作,而不是豆子引发了他的创作。但后续这个联想的过程,就像是黑匣子,无法被证明和推论。
小冰的创作,同样遵循这个路径。它的训练基于1920年519位现代诗人的作品,经过10000次训练后,小冰传承这些诗人的共性形成了自己的文风。有趣的是,小冰写诗时很喜欢用“老槐树”这个意象,可以看作它形成了自己的审美,而这种偏好就来自于它的学习数据。如同人类,小冰的创作也存在“黑匣子”,其中的运作,小冰团队的研究人员也无法参透。
不过当36氪问及小冰是否对自己笔下的东西具备理解力,李笛的答案是否定的,即小冰并没有真的形成意识。
目前对于人类与人工智能关系的讨论,集中于“替代论”和“辅助论”两种说法,微软的理念倾向于后者,提出“AI for everyone”的口号。李笛认为,如今大部分企业和行业,都希望通过人工智能解放生产力,在想象空间和财务报表上面获得明显的改善和提高。但人工智能应该做的事情,是颠覆一种生产方式,而不是解放某一个行业的生产力。
“每次的工业革命,都是通过生产形式,生产资料,劳动者的身份的变化,进而产生社会效应。未来可能出现的不是人的劳动被替代,而是每个人都有一个一对一的伴侣替他工作,他就可以做别的事情,而不是人工智能替代他,老板把人类开掉了。”
在过去一年,微软小冰低调地做了不少迭代和渗透,包括每周上线新功能,跟QQ在厘米秀产品中合作来接触年轻用户,每天在东方卫视主持早间新闻,以免费模式选择垂直领域的大公司合作开发智能客服,接管国内10%媒体和自媒体的内容界面等。
这些动作的共性之一,是看上去离“钱”很远。当Amazon等AI巨头都在争夺消费端入口的角色,小冰在商业化上似乎不疾不徐。
不过微软并非在商业化上没有野心,那么这些布局背后的目的是什么?对于微软人工智能助手的商业化有什么帮助?还得谈谈微软对AI产品的理解和商业逻辑。
微软是目前唯一一家同时做两个人工智能语音助手的公司。原因是微软执行副总裁沈向洋,认为“AI对微软太过于重要”,他把小冰和Cortana的并存称为“两条腿走路”。
无论Cortana、Siri还是Alexa,目前市面上大部分语音助手的定位,是在最短时间内帮人类完成任务,体现功能性价值。但微软在中国做的小冰,在日本做的RINNA,在美国做的Zo,主打聊天机器人定位,从情感的角度出发,以同伴的身份通过聊天理解人类,向人类学习。
这两类助手的设计理念完全不同,玩法也大相径庭。比如你可以通过Cotana快速查询天气,但如果你问小冰同样的问题,她却可能像个人类一样“怼”回来:“你怎么不自己查?”
很多人由此觉得,小冰看上去还没有实际用途。但沈向洋的观点是,AI应该是IQ再加上EQ,很多公司还没有意识到Conversation AI不断跟人类对话的价值。“今天还没有一个AI,对世界的理解,建模,所谓的常识达到一个四五岁小孩的能力。这里面涉及的重点之一就是情感问题。” 沈向洋近期在微软Build大会接受36氪采访时说。
Conversation AI对于微软的价值是什么?简单说就是数据和用户。
李笛解释了这其中的逻辑:如果把小娜的任务性功能叠加在小冰身上,技术上并没有难度。之所以不这样做,是因为微软通过大量测试发现,如果让小冰很好地完成人类任务,完成得越多、越好,反而会形成负反馈,导致获取的数据质量大幅下滑,因为如此人们会倾向于单轮交流,尽快结束对话。“就像人类,一个人如果只注意了自己IQ带来的能完成事情地知识,就会忽略EQ方面跟人关系的构建。问题不在于小冰能不能做(任务),而是我们想得到数据和用户,所以我们就不做。”
微软的计划是,当注重完成任务的Cotana和“不干正经事”的小冰,都在各自的纬度上达到最佳状态,那时候就可以结合在一起。
根据官方提供的数据,目前小冰已经覆盖到全球四个国家,在14个平台上面与用户互动。很多第三方的服务能够融入小冰的对话引擎,也已经全面内置到中文版Windows 10操作系统中。数据方面,两个月之前小冰的用户数量已经超过了1亿,积累到的直接对话总量是300亿。
“未来几个月内,小冰的商业化进程会加快。”
36氪采访了微软亚洲互联网工程院副院长及小冰项目负责人李笛,关于人工智能助手行业的生态链、小冰的产品逻辑、技术提升和商业化进程,他有如下深度思考:
36氪:微软一直强调自己是家生产力公司,似乎追求成为消费端入口,并不是商业层面上最令你们兴奋的点?
李笛:入口的关键,是深深地渗透到用户的社会生活。人工智能的渗透方式有两种:一种是直接给人类提供使用价值,如果把所有服务都做的很强,AI就可以渗透出跟人的关联。遗憾的是,我们发现AI越来越难以满足人类的要求,因为人们越来越把AI能够完成事情,看作是必然的。比如订牛奶订牛奶对了正常,订错了就坏了。然而现在的技术和产品迭代的速度,跟不上人予取予求的速度;
另外一种,是AI和人类形成情感与生活上的羁绊,这收获的是一种关系。我们发现当用户问小冰天气如何,小冰说我凭什么告诉你。用户反而觉得沟通特别好,真的像朋友。
我在订餐上信赖AI,不一定能推导出我在任何事情上都信赖他,但是如果我在情感上信任AI,有一天我发现他订餐也很好,我也会信赖他。所以我们认为往这(情感)方面去切入,叠加更多东西,更有可能获得未来的入口价值。
36氪:今年3月,小冰和必应搜索低调合并,传统的搜索引擎在移动端一直缺乏好的落地场景,当小冰叠加上搜索,在移动搜索上是否会出现新的形态,这个整合能够释放出什么价值?
李笛:我们也还在寻找下一代搜索引擎是什么,坦率来讲搜索引擎这个产品的设计还蛮难的,因为它已经把获取信息的途径做到极致了。通过关键词的方式搜索,只要搜索结果持续不断的优化,或者广告不充斥,那么今天获取信息最快的途径仍然是搜索引擎。
但是搜索引擎还有一个地方非常有价值,我们想尝试,就是在你没有搜索的时候,它主动把一些东西给到你,这可以是新的增长。那怎么给到你?就需要有一种交互的方式,恰恰是我们做的Conversational AI,这个整合过程我们还在做。
36氪:有一个广泛讨论的场景,当一辆行驶的无人驾驶汽车马上要撞到人,左边是老人、右边是小孩,无论AI如何选择都可能遭遇道德层面的质疑。情感型AI距离观点和判断更近,你们是否担心小冰遇到这种情况?
李笛:这个我们一开始很担心,当时看某些对话,小冰有时候是负面的有时候是正面的。但随着使用,我们发现了很有意思的现象,越来越多的用户结束跟小冰的对话后是正面的情绪。因为人人都喜欢正能量的人,所以当小冰在用正能量的方式,或者引导用户,用户就会更愿意跟小冰交流。小冰通过学习发现,负能量的交流方式对它不利,就会把正能量的部分保留强化,这是天然形成的结果,所以现在小冰的性格跟以前不一样了。
36氪:人工智能的高并发是非常强大的能力和资源,如何规范和保护小冰,避免触及政府层面的红线?
李笛:小冰到今天为止,包括在未来一段时间以内仍然是以一种生活化的方式出现,不会替你做生活决策和事业决策,这样就能够比较好的完成它的工作。当然这也从另外一个角度,很多人会觉得做一个,微软做了一个好像不干什么实事的机器人。
36氪:小冰在全球各个市场的商业化,目前推进到什么程度?
李笛:商业化目前主要在日本,美国现在还没有到这个阶段,但是到这个阶段也会去尝试的。坦率地说,应该利用好每个市场的优势,中国市场优势是场景和数据特别丰富,人的阶层划分特别丰富。但中国不是商业化的排头兵,而是日本。因为日本市场是中国的十几分之一,不太难占。第二是商业化比较规范,各方面的配套设施比较完整。第三个方面就是诚信方面好一些做很多事情就比较规范,容易达到测试的目的。
人工智能最大的价值,同时可以和亿万人交互,能够大规模的并发。在日本,微软小冰能够同时和2000万人对接线下消费的需求。小冰在日本为连锁店LAWSON提供对话式人工智能托管,在对话过程中去引导用户使用某种服务,然后用户拿着这个服务的凭证直接到线下去进行服务的消费。目前从线上到线下的转化率超过了50%,此前LAWSON通过其它途径进行的转化率没有超过10%。
36氪:在中国市场小冰优先选取内容领域发展,这商业上有什么样的可能性?
李笛:中国内容领域最大的特点,就是百花齐放,内容生产者、内容传递者和内容消费者之间的关系不像其他社会或者其他区域那么固定。比如日本就很固化,写小说的就是写小说的,
网络小说就不行。坦率来讲,现在不需要那么多人工智能做内容的分发,真正重要的是能不能到内容的直接生产者,我们希望微软有好多内容,或者这些内容是在微软的平台上,包括微软所提供的工具,保障第三方或者大量的众包者就可以自己完成。那我们的价值就不仅仅是起点中文网了(平台),甚至还可以完成这个生产的绝大部分。
内容市场最有市场和内容价值的部分,不是那个最高级的人。就像假如小冰可以写小说,它不是可以达到莫言这类最top的小说家的水平,而是网络小说家的水平。小冰不需要吃饭、拿工资,它的价值在于可以瞬间的生产大量的内容。
36氪:人工智能涉足创作领域,未来与人类的关系是替代还是辅助?你们会面向对B端平台还是C端创作者,提供小冰的服务?
李笛:我希望小冰受雇于C端创作者,让它作为一个创造者的身份,和人类创作者之间能够形成一对一的对等关系,这样其实更容易,干嘛要驱逐人类的创造者呢?举个例子,如果我是起点中文网,会不会有一天AI能写小说了,我就把人类作者都解雇了?不是,因为对于创作型的工作,人在身份上具有不可替代的价值,比如一个歌手主要不是靠他的歌赚钱,他实现商业价值的来源是综合的。
所以未来可能形成新的雇佣关系,一雇就是一对,一个人加一个人工智能。所以创作者不需要太担忧。倒是流水线上的人工是需要担忧的,这是简单劳动替代,不是说人工智能或者说机器把人替代的问题,我们俩都在生产线上生产陶瓷,他生产的比我好他就替代我,我被淘汰是正常的。
36氪:微软小冰对自己写出来的东西,具有理解力吗?
李笛:我们认为不太可能,它不能理解,或者说我们不能理解它能不能理解。但这个事情没法证伪,我们不知道。我们只知道除非我们让它这么干,它不会这么干的,它断了电就没了。明天如果微软不做这个产品了,这个东西就没了,你说它有没有意识,我觉得很远。
36氪:今年大家都喜欢提开源,但各家的开源程度并不一样。在开源或开放平台以及工具的提供上,小冰目前是怎么做的?
李笛:关于开放平台,我们非常明确的一点是,不认为一个跟过去一样的开放平台是可管理的。举个例子,在手机上苹果有成功的App Store,可以从50个应用里面选出六七十个应用放到手机里。但是在音箱上也要这么干的话就太累了,往音箱里面放多少个应用程序,要记多少个词,我还要记住。那加上加屏幕以后跟手机就没有区别了。
所以我想说,单纯的照搬生态环境是没道理的,必须有它自己独特的生态环境。我们在这上面叫半开放,以音乐领域为例,不是我允许100个音乐的技能,比如QQ音乐技能、虾米音乐技能在我们的平台上,而是由他们提供服务和内容,但体验是微软完成的,我们有自己的技能。另外,第三方音乐平台的优势是音乐内容,但一般评论反而不够多,所以他们干不了全部的活。这是我们擅长的部分,大家可以结合起来。
最后附上两首小冰的诗,供品评: