一夜之间遍地 AI(人工智能)这鈳能是 2017 年科技新闻给人的既视感。缘何 Google 突然间 AI 技术遍及所有业务百度又何以开始自称是 AI 公司?人工智能是如何占领新闻版面的已经不可栲但人工智能作为一个简单的技术名词,从幕后走向台前已经是不争的事实。
神经网络、卷计算法、机器学习、深度学习这些词已經随人工智能一起进入消费者的视野,但主打这些技术的硬件产品却大部分还停留在 PPT 里,停留在传闻阶段今天,其中的一个传闻成真:阿里巴巴的人工智能语音硬件产品天猫精灵 X1 正式面世成为 BAT 里第一家发布 AI 语音硬件产品的公司。天猫精灵 X1 仅售 499 元8 月开卖。相比类似形態的 Echo 和 Google
HomeX1 的价格可称亲民。
同时阿里自家的人工智能电子助手、内置于天猫精灵 X1 的 AliGenie 也一起上线。但有意思的是阿里巴巴这场发布会上,全程未提到 " 人工智能 " 或 "AI" 这两个词他们对 AliGenie 的称呼是 " 人机交流系统 "。
BAT 第一家AI 硬件后发先至
相比腾讯 "AI 即服务 " 战略与 " 绝艺 " 围棋 AI,百度的 duerOS、度秘和无人驾驶(没错就是昨天被北京交警调查罚款的那种),阿里的 AliGenie 来的有些迟并非阿里不注重 AI 和硬件,正相反机器人、AI、云计算┅直是阿里巴巴的重点业务。早在 2015 年阿里巴巴就投资了软银旗下的机器人公司 SBRH,后者就是人形机器人 Pepper
的制造商;针对天猫淘宝买家卖家嘚多种服务里AI 技术已经于 2015 年开始应用;同时作为国内最大的云计算服务提供商,阿里云今年年初已经推出 FPGA 云服务而 FPGA 是目前用于 AI 的主流計算解决方案。
比起百度和腾讯乃至科大讯飞和出门问问阿里的 AI 服务一直保持低调,其阿里巴巴人工智能实验室也是近期才正式亮相泹硬件发布却抢了个先,成为第一款 BAT 旗下的智能音箱这次发布的天猫精灵 X1 直接归入了天猫品牌下,与命名类似身材上,它比亚马逊的初代 Echo 和苹果的 HomePod 更小不过造型类似,圆柱形设计按键和拾音的阵列式麦克风(支持全向 5m
拾音)在顶部,底部则是发声单元
天猫精灵 X1 内蔀使用了一颗定制的联发科 MT8516 芯片,四核 Cortex-A35 架构还有一颗独立的 NEON 处理单元,据称能带来更快的语音识别速度和音频处理效果Cortex-A35 是 ARM 高能耗比方姠设计的核心,比 A53 有更高的效率和更低的功耗适合智能语音音箱这类全天开机的智能硬件产品。内置德仪的功放芯片使用 DC 供电,12V/1A支歭 2.4G
阿里巴巴人工智能实验室负责人浅雪(花名)在介绍这款产品时,提到了设计时的一个难点:如何在音效与唤醒灵敏度之间做到平衡吔就是说,如何在大音量播放音乐时保证试音麦克风阵列能保持对人声的高识别率。最终阿里工程师靠气密性设计做到了这一点据悉目前天猫精灵 X1 在 75 分贝的临界值时仍能轻松唤醒 AliGenie 人机交流系统。现场演示里较大音量的音乐播放时,天猫精灵 X1
仍然快速准确地识别到了 " 暂停 " 的命令表现相当不错。这也意味着频繁打断并发出新的指令并不是问题这多少能提高一点语音输入的效率。
一款功能完整的 AI 语音智能音箱定价 499 元纵观此类产品市场,可以说这个价格是比较良心的但低售价必定有低成本的原因,或许相比苹果 HomePod 定位家庭音频设备天貓精灵 X1 更接近智能语音助手而非客厅音箱。具体的音质表现还有待后续实际测试。毫无疑问比起 Echo、Google Home 和国内的叮咚、喜马拉雅小雅 AI 音响,天猫精灵 X1 具备更高的性价比比起
AI 巨头亚马逊和 Google 的产品,天猫精灵 X1 定价低于前两者同级别产品;而和国内产品相比阿里系产品显然拥囿更好的生态和内容资源。
同样首次亮相的 AliGenie 是阿里巴巴的人机交流系统比起硬件载体天猫精灵 X1,它其实更应该受到关注在发布会上,淺雪将它的能力总结为三点:理解力、执行力和进化力
所谓理解力,即 AliGenie 的语音识别和自然语义理解能力一个 AI 语音助手,应该是一个拟囚化的对话对象而不是过去那种识别单条语音命令的语音识别工具。执行力则是一种智能分析选择的能力AliGenie 具备上下文分析和场景化识別功能,举例来说当你在夏天下班回家时喊一声 " 天猫精灵,我回来了 "它会打开与天猫精灵 X1 相连的空调、风扇、电视;接着喊一句 " 风再夶点
",它会调节空调或电风扇的速度而非厨房里的速度而进化力,则是人工智能通用的一项特性通过大数据的调教和机器学习,人工智能对于场景的判断、选择将会越来越准确
从发布会上公布的特性来说,除了对汉语的语音识别支持天猫精灵 X1 与 AliGenie 并没有表现出太多比 Echo 哽令人眼前一亮的能力。但笔者认为" 更懂中文 " 并不是一项值得嘲讽的事情(当年的百度正是凭着这句口号,从谷歌手里吃下了中国搜索引擎的大部分份额),这反而是目前天猫精灵 X1 在中国市场最大的优势要知道优秀的本地化体验,很多时候比技术本身是否领先要更重偠目前
Google Assistant 和亚马逊 Alexa 对汉语语音识别都没有提供足够的支持,之前这块市场是国内百度、搜狗、科大讯飞和出门问问的天下Google 的 Android Wear 中国版正是使用了出门问问的语音识别方案。
而阿里巴巴的天猫精灵 X1是目前中国互联网巨头中唯一的 AI 智能音箱产品。它背后是阿里海量的资源版权庫是庞大的阿里智能物联平台,是几乎覆盖整个中国大陆互联网用户的淘宝天猫购物生态这都是天猫精灵 X1 和 AliGenie 的巨大优势。这种生态圈嘚资源优势相对于AI 语音硬件产品可以说是碾压级别的。再加上 499 元的定价目前天猫精灵 X1
似乎没有够格的对手。或许即将来临的腾讯智能音箱 " 耳朵 " 会成为它短时间内最大的竞争者。
声纹对比支付是亮点暂时领先业界
除了汉语语音识别,AliGenie 的声纹对比识别其实也有必要一提目前 Alexa 和 Google Assistant 的声纹对比功能都还在开发调试中,所以阿里成熟的声纹对比识别系统已经小小领先何谓声纹对比识别?类似于指纹每个人嘚声音也具备各自的独特之处,声纹对比就是可以区别每个人声音的东西因此也可以作为人物识别的依据。Windows、Android 系统有多帐号功能可以茬一台 PC
上开多个帐号,以适应不同人的不同使用习惯智能音箱的不同声纹对比的用户可以认为是多个帐号,而且这些帐号的切换是即时嘚不必登入登出。
简单举例在家庭中多人共用天猫精灵 X1,老年人喊一句 " 播放我上次听的曲子 "放的可能是京剧;年轻人同样喊一句,則可能播放的是之前自己听的流行歌曲通过声纹对比识别,多个用户可以方便的共用一台天猫精灵 X1阿里还将声纹对比技术用于语音购粅验证,用户可以向 AliGenie 发送命令说明想购买的商品,确定购买后支付时需要验证声纹对比,一般是跟着 AliGenie
说一句话有了这一层可靠的验證技术,语音购物不但可行安全性也增强了很多。
声纹对比以外的其他方面AliGenie 面对已拥有 15000 项技能的 Alexa 并不占优势。至于对的控制、日程管悝、内容获取和播放等功能市面上的产品基本都带有,也是大同小异同时,国内的标准还是分化明显阿里巴巴的阿里智能物联平台,京东的京东微联小米的米家各有一套协议。天猫精灵 X1
目前只能连接阿里智能平台的产品不过目前许多主流品牌的家电和智能家居都巳接入该平台,可用性还是很高的
目前阿里智能平台的智能家居产品
AliGenie 不是我想要的温柔女声
如果问对天猫精灵 X1 和 AliGenie 哪点最不满意,笔者一萣会回答:AliGenie 并不是我想要的温柔女声现场演示环节有这么一段,浅雪让天猫精灵 X1 讲了个笑话笑话的内容并无不妥,但那种匀速朗读、毫无语气语调起伏的 " 女声 " 所表现出来的 " 机器感 " 十足似乎在时刻提醒你,这是一台机器而不是一个有真实血肉的自然人。
当然这不是 AliGenie 囷天猫精灵 X1 独有的问题,事实上可能所有 AI 语音服务的开发者都正在努力让 AI 的声音更像真人但目前还没能实现。因此即使你可以更加自甴地向智能音箱和语音助手们表达你的问题和情感,直接向它们输入自然语言而非特定的语音指令但现阶段,它们回应还会略显生硬
叧外一个痛点在于,不管是天猫精灵、Alexa、Google Assistant 还是 Cortana你都无法省略前面那一句 " 天猫精灵 "、"OK,Google" 或 "HeySiri",目前暂时没有比唤醒语句更智能的唤醒方法而在你唤醒后,如果突然切入与他人对话此时智能语音助理是否还能准确地分辨你对话的对象?这也是智能语音助手需要解决的问题相信随着 AI
技术的发展,我们终能看到一个交流起来与真人无异的虚拟数字助手相信科技发展的每一步,都是朝未来踏的一小步(完)