马云刚说“提起人工智能这几个字很生气”,阿里就发布了首款AI硬件产品——天猫精灵X1。不要误会,马云生气的是现在业内对人工智能的定义,而不是人工智能这件事。从趋势看,人工智能必须是未来。要不,仅仅是“智能音箱”这个细分领域就挤满了主流厂商。

亚马逊的Echo不是最早面世的产品,却最成功。前有苹果,后有谷歌和微软先后进入智能音箱领域,成效并不明显。那么问题来了,为什么这些最前沿的厂商纷纷要进入“智能音箱”领域,看重的是什么?在中国,类似的产品也较多,为什么都不成功?这时候阿里发布天猫精灵,意思也在“智能音箱”这个生意?

完全不是这样,我们认真对比了Echo和天猫精灵的定位,从4个角度找到原因,这也是为何阿里如此重视的原因。

▲这不是智能音箱的生意

要搞清楚一个基本概念,这些厂商做“智能音箱”的目的不一样。苹果可能真正在做一款音箱,是“智能”的,外观漂亮,设计完美,音色绝美,彰显苹果的科技感;亚马逊Echo不是“智能音箱”,是家庭控制中心,语音交互是入口。

所以,从概念来说,标签为“智能音箱”产品的玩法不同,这也决定了国内大多数做“智能音箱”的IT、互联网厂商走不远。从音箱的角度说,消费者需要的是一款IT厂商打造的、蓝牙连接的智能音箱还是需要哈曼、Sonos顶级品质的音箱?更何况,蓝牙操作、还要打开App,点击合适的歌曲,还要求歌曲的品质,如此复杂,注定“智能音箱”走不远。

来看看亚马逊的Echo是什么。

只要用语音交流,Echo能完成大多数任务,帮你打开窗帘、关闭电视、提醒日程、开锁,甚至是一键购物。Echo是智能设备,是“贴心管家”,是用语音交互的设备。大多数人不知道的是,最早Echo也设想过带显示屏,初期版本也标配了遥控器。但发现使用率太低,放弃。

从功能来说,天猫精灵和Echo相似。官方介绍从来不是“智能音箱”,而是“第一款AI硬件”、是“首款智能语音终端设备”,这决定了该产品想要的是抢占“语音交互”的入口,而不是在于一款音箱。

再说,音箱的生意有多大,这些巨头会在意吗?

▲技术突破口在语音交互

“智能音响”看起来很热闹,如果没有语音交互系统的支持,也是噱头。苹果的SIRI、谷歌的NOW以及微软的小娜均是核心技术。为什么别人家做不成,因为语音交互太难了。

亚马逊的Echo在发布之前,有长达两年的研发时间,攻克的核心问题竟然就是语音交互的延时、缩短响应时间,从过去7秒缩短到1秒。就这几秒钟牵扯到太多的因素,环境、识别率、网络、发音等。

语音识别是“智能音箱”中最重要的技术问题。在实际应用场景中,每个人每天的语气和环境都不同,不可能像实验室那么纯粹,没有良好的语音识别系统,不可能普及。

在这一点上,天猫精灵内嵌阿里第一代中文人机交流系统AliGenie,由阿里人工智能实验室(A.I. Labs)研发。这是一款生活在云中的系统,可以不断智能化演进。

从硬件来说,天猫精灵X1采用了首颗专门为智能语音行业开发的芯片,在解码,降噪,声音处理,多声道的协同等方面做了专门的优化处理,采用六麦克风收音阵列技术。天猫精灵X1背后的团队在降噪技术上做了大量研究,并专门针对家庭使用场景做了优化,具有一定的学习功能,可以根据环境噪音进行学习和进化,适应不同家庭环境噪音,经过7天左右优化,会更加适应所在家庭环境。

技术,从来不是难点。

▲如何懂复杂的家庭场景

既然应用到家庭,必然是复杂的应用环境。孩子哭了闹了宠物哼哼烹调炒菜路边吵杂电视背景声调距离多人交流等等都决定了应用的复杂性。这样的智能设备该如何分辨你真实的意图?或者说,我们能用这样的设备做成什么事情?

比如,就有消费者吐槽用智能设备关灯这件事情,先打开手机,找到关灯APP,再找到关灯按钮操作。如此复杂,不如跑下床按下开关。智能设备也是如此,在所有的噪音中,反复说关灯关灯,没反应,这不是很失败?

从家庭环境来说,我们需要更智能的设备,更懂我们的设备,而不是每一项琐碎的事情都要埋头在手机中,点点戳戳完成。想听音乐?想看个电影?想了解天气状态?想知道明天的安排?没问题,直接问设备足矣。当然,前提是需要在系统中设置好规则。

家庭场景决定了这款设备的用途,决定要懂复杂的中文环境。Echo之所以进入不了中国,只能在欧美国家销售,一个重要的原因是中文的语境太复杂了。比如说“关灯?”这么简单的词汇,在不同的语境下——吵架、讨论、安静、发出指令的含义完全不同。

天猫精灵的优势是,依托强大的底层技术、智能的算法引擎、完善的云端服务和成熟的软硬件标准系统,更懂语音。这一点,需要对阿里有信心。在现场真实的演示中,我们也看到了更多惊喜。

▲下一场入口是什么

这些年我们谈论了太多的入口,手机是入口、App是入口,智能设备是入口。入口的意思就是流量,是控制枢纽。现在看,交互式智能语音系统将成为人工智能细分下的一个入口,它与不同场景下的应用结合起之后,就能发挥巨大价值。

所以,这些一线厂商纷纷进入“智能音箱”的目的是,成为语音交互的入口,成为家庭的终端,这背后的生态和生意,足有想象力。所以,天猫精灵仅是适合家庭环境下的一个典型性代表,是阿里的第一个黑科技产品,而AliGenie的应用场景太多,无人驾驶、无人值守的商城等等。

谁拥有了这个入口,就等于有了家庭的平台,可以做的事情太多。以上说的购物、查询、知识互动和娱乐,背后是一个强大的生态系统。阿里有什么?它有高德地图、支付宝、天猫、抓虾、淘票网、飞猪、滴滴等人类生活中衣食住行各类强大的生态系统,可以满足家庭环境下的需求。

所以,本质上,天猫精灵是平台,是一个强大的生态系统;而支撑这个平台的手段是语音交互系统,进入这个平台的是人的语言。有了这个逻辑,就不难明白,为什么阿里要召开如此盛大的会议。这个产品具有太多的能量,一旦释放出来,成为阿里集团下所有交易的流量入口,更是成为语音交互系统其他场景下借鉴的对象,更可重构现在的商业模式,引发另一个技术创新。

那时候,手机是什么? ')}