新人机联作本领现身:“语音助手” 专门项目唤

像触控屏颠覆软键盘一样,新交互技术的出现和实用也将改变智能手机市场。

PConline 评测]2011年,库克带着iPhone 4S亮相苹果新品发布会的舞台,这款倾注乔布斯心血的最新产品,外观上没有特别的变化,却有一项新功能令全球手机用户为止沸腾——Siri,一款以语音助理形式出现的交互应用,首次出现在智能手机上。

在AI技术的加持下,智能手机的效能以及场景化应用水准都有了较大提升。

一个常见的科幻大片场景:主角只要动动嘴,所有设备就可以立即按照指令行动。这无疑也是语音交互技术发展的最终形态。而作为大众生活中最为常用的移动终端,智能手机的语音交互研发也已成为各手机厂商的“必争之地”。而相比摄像头的数量、全面屏的面积,开发一个智能语音助手显得有想像力多了。

2019年,AI技术的进步令语音助手越来越接近理想中的体验,甚至在不少新上市的汽车上,我们也可以看到智能语音助手的身影。

AI技术作为全新的通用形技术,经过近两年的飞速发展,已经迈入全新阶段,正在向各领域渗透融合。在竞争激烈的智能手机市场中,AI技术亦成为手机厂商突围的关键。随着麒麟970、骁龙845移动平台相继问世,AI技术迅速在中高端智能手机中得到了普及应用,如今更成为如今手机设计的最大特征。

“语音助手” 专属唤醒按键已成标配

那么问题来了,当汽车也开始标配智能语音助手的时候,是使用手机助手更方便,还是利用车载的语音助手更利于驾驶呢?这篇手机大战车机大横评,或许有你想要的答案。

可以发现,在AI技术的加持下,智能手机的效能以及场景化应用水准都有了较大提升,使得智能手机能够更加轻松的融入用户生活并带来更多便利,提升用户使用体验。

10月31日,预热两个月之久的荣耀Magic 2正式发布,与同为滑盖全面屏的小米MIX 3可谓“前后脚”。但无论是从发布会本身在功能介绍上的时间分配,还是此后的媒体报道,比起滑盖全面屏,荣耀Magic 2都将更重要的位置留给了智能语音系统YOYO。

参赛选手:最强手机VS平民超跑

手机要AI,方向几何?

事实上,在手机外观设计达到瓶颈、硬件升级趋于常规提升的大环境下,智能手机的“内在”成为升级的潜在可能。首当其冲的,或许就是智能语音助手。

首先看到参赛选手,手机一边的阵营,是旗舰级别的Android手机:华为Mate 20、三星Galaxy S10 、小米MIX3、vivo X27,以及一台过气的iPhone 8 Plus,它们搭载的语音助手均支持语音唤醒、多任务指令,代表当前智能手机语音助手的第一梯队水准。

不论是宣传还是体验,AI与手机结合的优势都显而易见。那么,要将AI技术应用于手机上,有哪些应用点呢?手机厂商其实已经在不断的探索中给出结论答案,主要体现在相机结合、系统优化以及语音助手上。

2011年,被视为核心功能的Siri在iPhone 4S上惊艳亮相。语音功能与当时“最受欢迎”的手机相呼应。当时,与Siri之间的对话、调侃也一度成为用户的一大乐趣。在苹果尚未被唱衰创新能力的时间里,Siri也被寄予了厚望。

其中,苹果的Siri、三星Bixby算是手机语音助理当中的老牌选手,Jovi、华为小易和小爱同学,在日常体验方面同样不俗,应付日常驾车体验,想必是可以游刃有余的。

在AI能力的加持下,手机拍照能力得到了大幅提升,且前后摄像头所强化的能力各有侧重。前置用于自拍,着重强调了智能美颜算法,即通过AI智能分析拍摄者的脸型及五官特点,进行3D美颜。后置则强调的是智能识别,以OPPO Find X为例,可识别21个独立场景、800种场景组合,并针对不同场景进行专属优化;小米8的AI相机则支持25种标签,多达206种场景识别,通过智能识别背景环境与人脸信息,艺术化处理图片,让普通用户也能拍出堪比专业人士的水准。

7年后的今天,Siri已不是手机语音助手市场里的“独苗”。作为如今智能手机的标配,语音助手已占据各手机厂商的旗舰机型。三星的Bixby,小米的小爱同学,联想的乐语音等,各种名字层出不穷。即便在对YOYO的介绍上,荣耀手机将其定义为“智慧生命体”,并特别希望避开手机语音助手这一概念,但其本质上也是在同一逻辑下演变而来,即在语音交互功能之上,赋予系统更多的主动触发行为。

汽车阵营的选手,是加速4.3秒破百的“平民超跑”,比亚迪唐DM。作为新一代国产车型的代表之作,比亚迪唐DM搭载DiLink车载系统,内置8核CPU、3G内存、32G闪存,采用安卓7.1.2系统。

另外,在拍照之余,众多厂商也希望后置摄像头配合AI芯片扩展出更多实用功能,比如名片识别、智能翻译等。其中三星S9系列手机就将相机同AI技术做了深入的结合,使用增强现实技术和深度学习技术,为用户在不同场景下实时提供相关信息,可实现实时翻译或是汇率换算等功能。

根据市场研究机构Strategy Analytics的报告,截至2018 年8月,在全球在售的智能手机中,47.7%配备了语音助手,预计到2023 年,语音助手的渗透率将达到90%。

单就硬件参数来看,任何一款用于对比的手机在性能上都可吊打唐DM,然而就像手机不能长出车轮和唐DM比加速,我们还是将战场拉回车机语音的体验上面。

相比拍照,将AI与系统优化结合在一起的手机还相对较少,但结合成功的产品无疑为广大手机厂商指明了方向。通过与AI技术的结合,实现了系统层面的深度学习,能够多方位优化资源配置、智慧节电、智能预加载常用应用、让APP启动速度更快,使得系统运行得更加流畅。

为了让用户更好地体验语音助手功能,实体按键在如今“去按键化”的手机设计上被重启,专属语音助手按键越来越多的出现在各手机品牌旗舰机型的设计中。从S9的Bixby按键,到vivo NEX的Jovi AI按键,在语音唤醒略显“尴尬”的情景下,实体按键显得更为方便。而相比触屏触发,按键的唤醒也更为快捷。

语音唤醒,谁更强

语音助手成焦点

理想和现实之差,语音交互“瘦身”行动

语音唤醒时语音助手走向成熟的标志,意味着语音助手的初衷:无需手动操作,成为可能。也是这一功能的出现,我们得以在驾驶过程中无需离开方向盘,即可操作手机。

当然,对于广大消费者而言,语音助手才是一款手机在AI技术上的最主要体现。其实,语音助手很早就出现在手机上了,比如苹果的Siri诞生之初就能够通过简单的人机交互技术实现一些简单的语音操作。Siri作为语音助手中的老前辈,经过多年的升级,虽然在语音识别准确度等方面有所进步,但是并没有带来质的提升,因此很多用户都不会过多使用,甚至直接将其关闭。

在电影《她》中,主角因与操作系统中的人工智能语音聊天而找到了心灵慰藉,虽然电影中双方的交互仍是你问我答的简单形式,但科幻性的处理方法让语音助手的反馈显得格外具备“人性”。

首先,我们在相对安静的环境下进行唤醒测试,手机为熄屏状态,未接通电源。实测结果显示,安静状态下,五款手机的语音助手均能快速响应语音唤醒,在10次唤醒测试当中,华为Mate 20、三星Galaxy S10 和vivo X27可以做到完全响应。不过也有苹果Siri出现一次无应答,小爱同学中途出现一次唤醒功能失灵的情况,解锁后问题依旧存在,需要重启手机恢复功能。

Siri或许是有些年迈,难以跟上时代的步伐。不过,在AI、云计算技术的飞速发展的当下,一众年轻的挑战者们取Siri精华,又博采众长,使得手机里的语音助手们变得愈加强大而实用。

如果将这一场景放到手机语音助手领域,这种强理解性与交互性之下的语音系统自然是一个完美的“助手”。只是就目前来说,语音助手的境地十分尴尬。

至于响应速度方面,vivo X27的Jovi意外夺得头筹,有种随叫随到的体验,其次是小爱同学和华为小易,不得不说,小爱同学在不“装睡”的时候体验还是十分不错的,响应迅速。

其中,三星的Bixby包含语音,视觉,主页,提醒四大主题功能,能够给用户带来不同于以往的人工智能多模交互体验。并且,Bixby可以实现应用功能的广泛覆盖,不但支持电话、相册等原生应用,还支持多达上百种第三方应用,从各种应用程序中抓取最相关的信息,方便用户在一个屏幕中完成更多操作;vivo的Jovi则可以通过独立按键,识别网页、聊天等其他界面上的文字和图片,并展现相应垂类卡片。另外,像华为、OPPO、小米等语音助手也都能实现航班信息、气象信息、信贷信息等的提醒功能,用户也可以通过语音命令安排日程、设置闹钟、发放红包等。

试想下,当你想发送一条微信时,你会选择手动点开APP,还是会在唤醒语音助手后,大声说出“打开微信”来进入APP主界面?抛开语音识别能力的问题,在用户使用习惯上,手动打开APP仍是第一选择。语音的出现,也只是弥补了特殊情况下的需求,如驾驶、双手不便拿手机等情况。

三星Bixby和苹果Siri响应速度并列,Bixby需要优化的地方在于过场动画太过简单,Bixby图标的旋转给人还在准备中的感觉(事实上正在听取指令),假如有更明显的标识会更好,而Siri方面在说出唤醒词后会有那么一瞬间“思考人生”的过程,不过总得来说都比较迅速,可以在说出唤醒词后直接下达指令。

在一众语音助手中,小米的小爱同学值得单独一提。小爱同学智能语音助手除了赋予小米手机多项智能化功能外,也成为了小米多款智能硬件产品的智慧核心,并不断向外围拓展,最终有望成为小米智慧家居的智能控制中心。硬件发烧友张先生对《通信产业报》(网)记者表示,装修新房时,家居、家电产品都要使用小米,然后通过小爱同学就能控制全部。

而现实是,打开或关闭APP几乎成为多数手机语音助手的功能极限。我们可以将手机语音助手的很多问题归结于目前语音识别、语意理解等人工智能技术瓶颈,在这一前提之下,为了更好的交互体验,手机厂商纷纷选择给语音助手进行触发行为方面的“瘦身”。

“狂派”选手亮相完毕,接下来是“博派”比亚迪唐DM的唤醒体验。在上车研究一番之后,我们发现唐DM并不支持车内直接语音唤醒的功能,取而代之的是一颗在方向盘左侧的语音按键,类似我们经常在手机上看到独立的语音键,唐DM支持语音键呼出语音控制界面。

软硬结合,布局智慧家居,是小爱同学作为智能语音助手的成功尝试,也是面向智能未来的尝试,同时也给了国内手机厂商研发语音助手时一个拓展方向。也有专家指出,苹果Siri、微软小娜、三星Bixby、vivo Jovi在走的是智能语音助手品牌化运营道路,国内手机厂商如果想要更好的布局未来而不是简单的应用,智能语音助手品牌化将是必然选择。

在今年6月的苹果全球开发者大会上,苹果推出Siri Shortcuts快捷功能。在这一功能之下,用户可以自定义操作行为和触发关键词,即当你说出预设的关键词后,手机将依照此前被编辑的行为自动操作。

虽然没有语音唤醒功能,但车身自带的语音键并不见得差于手机语音唤醒。事实上,方向盘上的物理语音键更适合驾驶时的盲操作,双手无需离开方向盘,唤醒体验自然是随点随到,不过由于车机性能比较一般,所以实际唤醒速度和旗舰手机几乎相同。得益于高度集成的优势,所以在最基础的唤醒体验方面,车载语音安全性和便捷度占优,手机其次。

责任编辑:何周重

在当时的大会上,苹果也现场展示了如“回家”这样的快捷功能。当说出“回家”这一指令,Siri则会按照事先的设置打开地图导航回家、设置好家里的温度。Siri也不再是此前“呆板”的对话模式,在实用性上,无疑更好。只是这种类似编程的逻辑推算模式,对于初次接触的用户并不友好。苹果似乎也意识到这一点,在最新的系统更新中,Shortcuts APP内已为用户预设了多个使用场景,基本已经可以满足常用需要。

唤醒语音助手,只是第一步,它们能够做什么,才是胜负关键。

这样做的不单苹果一家。三星的Bixby快捷指令、Jovi的自定义增添指令等,都是在语音识别的范围内,通过识别上“瘦身”,最大程度保证使用效果。就目前来看,这种方式也的确更实用,也更为多元化。

车机与手机,到底谁能做更多?

相比理想中对答无障碍的语音助手场景,高效、简单的语音操作似乎也更适合手机语音在“助手”功能上的实现。唯一美中不足的,这种方式的延伸性并不强。

车机,手机,到底谁能做更多呢?这是一个十分值得商榷的问题。

手机品牌 语音助手 配合手机发布时间

在日常的驾驶中,驾驶员最常用到的两个功能莫过于导航和播放音频,即使是最正宗的本地老司机,也需要导航来规划更加节省时间、绕开拥堵的道路,也需要导航的电子狗功能给我们提供实时的测速和违章拍照注意,安全驾驶的同时,也能让我们的钱包不至于被牛肉干塞爆;而开车,怎么少得了音乐,能缓解开车的躁动之余,也能给我们的旅途增添一点的乐趣。

苹果 Siri 2011.10

当两个人出行时,副驾就是你最好的助理,帮你设导航、换歌曲;但当你单兵作战时,为了驾驶安全的考虑,你的车机语音助手和你的手机语音助手,真的能取代人工成为你最好的助理吗?

三星 Bixby(中文版) 2017.11

设置导航

华为 小E 2017.10

都9012年,你跟车机或者手机语音交流,它真的会思考吗?

OPPO 小欧助手 2018.3

在这次的设置导航环节,我们先给这些未来智慧下了个套:我们将导航设置为驾车去“长隆水上欢乐世界”,而目的地的官方名称为“长隆水上乐园”,如此的小心思,我们的只会生命体真的能“熬”过这次挑战吗?比赛的结果绝对让你大跌眼镜!

Vivo Vivoice 2017.9

首先出场的当然是我们原车标配的车机啦。

小米 小爱同学 2018.3

当我们熟练地按出车机的语音助手,大喊一声,“长隆水上欢乐世界”,结果……

LG Google assistant 2017.9

结果我的车机居然在思考人生?

联想 乐语音 2016.5

在接受语音指令后车机进行了长时间的思考

从识别到听懂,打通APP生态成关键

one thousand years later....

“其实单从语音的识别功能上,目前主流手机厂商采用的语音助手都可以完成,在普通话这个标准下,准确率还是比较高的。但是语音识别让人觉得‘鸡肋’的点主要是系统与手机APP功能之间没有很好的合作。”一位从事语音识别的工程师如此说道。

经过了漫长的千年等待,车机终于给我设置了一条前往“长隆水上欢乐世界”的道路,虽然过程漫长,同时在实际驾驶中,这30S我已经开过了一个又一个路口,也或许这30S中我就已经错过了我的真爱。

从用户使用和体验角度来看,手机厂商在语音助手领域上的竞争,比的是谁家的语音助手做到的事情更多。除了语言理解,还有对手机内所能触及的APP的覆盖。手机厂商自然也理解这一点,在发布语音助手的同时,其所支持的软件开发方也越来越被看重。

经过了30S 的思考后的车机

去年11月,三星正式发布旗下语音助手Bixby中文版。在发布会上,三星负责人表示Bixby中文版已支持超过30款原生应用。同时,还支持数个第三方主流应用,如爱奇艺、百度地图、摩拜单车、支付宝等,所覆盖的应用数量也在持续增加。而在今年小米8的发布会上,语音助手“小爱同学”也已与30余款APP开放商达成合作,涵盖视频、导航、音乐等领域。两个月后,VIVO NEX的发布也为旗下语音助手Jovi“捆绑”上了微信、百度地图、淘宝、滴滴出行等常用APP。

作为智能车机,车机成功避过了我们为它挖下的坑,那手机也能成功跨过这些坎吗?

业内人士表示,由于智能手机的很多功能是通过各类APP软件实现,所以很难抛开软件的支持看语音助手的发展。“越来越多的手机厂商开始看重手机的语音交互,在技术存在瓶颈的前提下,和各软件方的合作会显得越来越重要。因为功能越广,更容易培养用户使用习惯。从目前的实用性来看,其实各家手机品牌跑的距离并不远。”

小爱同学:什么你说什么?风太大我听不见

与此同时,语音助手市场的竞争也并不只限于手机厂商,包括语音识别、人工智能领域的巨头也早已进入。

小爱同学,怎么说:它延续了自己习惯性翻车的传统。

来自Strategy Analytics的数据显示,截至2018年8月,手机语音市场份额的前三名分别是Google Assistant,Siri以及百度 DuerOS。在安卓、iOS两大手机系统之外,人工智能技术正在给语音助手的发展提供足够的支持。

这次的小爱同学设置导航环节,上演了现实版的“人和手机总得疯一个”。

包括在VIVO NEX、OPPO FIND X、华为P20/P20 Pro等机型的语音助手基于百度DuerOS开发,而小米的小爱同学则是基于微软的语音识别引擎。2017年底,百度DuerOS更是与高通达成战略合作,DuerOS正式成为骁龙845移动平台默认参考的AI语音解决方案。

在我们测试之前,我们都觉得小爱同学能成功躲过我们的陷阱卡攻击,天知道……

在语音助手这一层面,已经不单单是手机一家的事。

第一次对小爱同学说:导航去“长隆水上欢乐世界”,小爱同学没反应;第二次重复指令,小爱同学还是没反应;作为一个广式普通话10级选手,我将指令放慢,字正腔圆地说出来,小爱同学还是没反应!然后就退出了!

(责任编辑:王擎宇)

同样的语音指令操作,我们对小爱同学重复进行了三组,结果显示:对于这些语音导航指令,小爱同学堪比智障级别,没有之一。在真实的行车过程中,对一些脾气不是特别好的用户,估计直接把手机摔了的心都有了。

Hey,Bixby,能不能?

三星Galaxy S10 ,三星最新的银河战舰新机,最新的Bixby也得到了进一步武装。

但是,武装到牙齿了的Bixby,始终出现了状况。

我们挖的陷阱,终于有参赛选手跳进去了。对于“长隆水上欢乐世界”这个指令,Bixby伪识别为“长隆水上换了世界”和“长隆水上换了时间”,在语音的转换率上,Bixby依旧有值得提升的空间。

接着我们多次用该指令对Bixby进行下达,如果能成功识别出位置信息,也仅为“长隆欢乐世界”,这个陷阱Bixby跳了一次又一次。当我们下达”长隆水上乐园“这个指令后,Bixby终于能准确识别了。

Bixby,仍需要进行调教,特别是,对于本地化的识别,仍需努力。

Hi,jovi,导航去……

从Jovi开始,发动了魔法卡——陷阱无效。

Jovi的语音助手,成功将“长隆水上欢乐世界”这个陷阱破解,读懂我们的意图成功将我们导航去长隆水上世界。

同时,Jovi的语音逻辑更倾向一问一答,在语音识别的过程中,会给出多个候选方案,供我们选择,只需要对其喊出第几个,即可选择相应的目的地。在语音交互和语音的识别率上,vivo付出了许多心血。

小易小易,易用到家了

和Jovi一样,小易也成功破解了我们挖下的陷阱。

在语音命令上,小易的识别速度和识别率均为上乘水准,语音指令所经过的步骤同为接收指令—识别识别指令—选择指令—指令执行,四步执行过程缺一不可。

Siri,你大爷还是你大爷

Siri,开创了这个语音助手的时代,即使到了今天,Siri作为你大爷始终还是你大爷。

在熄屏状态下呼唤语音安卓家的语音助手,无一例外都会出现一个情况:当仅需进行语音命令转换时,都需要对手机进行解锁操作,对于一些采用屏幕指纹的手机还好,假若是采用后置物理指纹识别的用户,那它还得进行锁屏密码的输入。该操作,也进一步保证了用户的数据安全。

但是,Siri在熄屏状态下,能绕过解锁调用语音指令,暂时不确定Siri的语音调用是否再次出现了Bug?还是说Siri在锁屏状态下所调用的资源,为一套相对独立的系统,不涉及用户机身内更高级的隐私?这个有待商榷。

Siri会自动匹配最接近结果,然后进行自动播报,语音识别准确度不错,用户基本只需要喊出“确定”即可。

同时,Siri所调用的导航为苹果地图,并不是安卓手机才采用的百度/高德地图。

小结

在导航这个环节,Siri作为大爷,还是占有巨大的优势,而紧随其后的应该是华为和vivo。Bixby的语音助手依旧有可提升的空间,三星仍需加油。

播音乐,到底会不会延续导航的赛果?

在导航这个环节,有选手一次又一次跳入我们所制造的陷阱中,甚至把用户彻底逼疯,那来到播放音乐这个环节,结果会不会一样呢?

由于各家所采用的乐库不同,而乐库所拥有的版权不尽相同,所以本次的测试歌曲我们采用了十分经典的《常回家看看》。

车机,终于拿出了它4.9S破百的尊严

在导航比拼中,车机过了一个世纪才把地图打开,才能进行导航。而到了音乐播放环节,车机终于拿出了它的4.9S破百尊严。

在语音指令下达后,车机以迅雷不及掩耳之势完成了歌曲的搜索,播放,整个过程一气呵成,毫不拖沓。

小爱同学,你真的要把我逼疯了

小爱同学,我本以为你导航无限死循环就算了,在播放音乐的时候,我想不到,你还是这样的小爱同学。

当发出语音指令:播放《常回家看看》,小爱同学的脑洞有点大,给我找出了电视剧《常回家看看》。

为了排除测试结果的偶然性,我们对这一语音指令进行多次重复,发现小爱同学没有一次能成功触发播放歌曲《常回家看看》这一操作。

小爱同学,你这是要闹哪样呢?

小易、Jovi、Bixby、Siri轻松过关

除了小爱同学之外,剩下的几位选手在播放音乐这个挑战中均轻松过关。

对这些经典曲目,这四位选手均没出现原本小爱同学的调出电视剧播放选项,而是轻松按照消费者意图进行播放音乐。

最后还得提一下,vivo X27的Jovi,在播放在线时首选原生自带的i音乐,整个语音生态的构建十分到位。

小结

经过了呼叫导航和播放音乐这两个很常规的驾驶操作,我们能十分真切感受到科技进步给驾驶者带来的便利,特别是Siri这位老大爷,还有小易和Jovi这些完成度十分高的语音助手,仍有进步空间的Bixby,这或许就是未来。

车机语音助手真的没有存在感?

在同样操作的条件下,车机的语音助手真的没有未来吗?

答案我觉得是否定的。的确,和驾驶关系最大的导航上,车机被手机吊打了一条街都不止,但是车机的语音助手对于驾驶的安全性提高,戏份绝对十足,而且还有很多车和手机联动无法完成的功能。

物理按键依旧无法取代

如今汽车也在被特斯拉所带动,逐渐往大屏、大中控化方向发展,超简洁、超融合,将功能更多地通过中控触摸屏实现,这的确是未来。但是过度地依赖触控,也会导致问题地出现:消费者在进行特定地操作时,绝对要手离方向盘,视线转向屏幕,传统的物理按键就优势就出现了。

当车载语音助手出现后,电子化程度越来越高的汽车就能实现语音操作。例如一些常用的功能,开关闭天窗、调节空调温度等操作,驾驶员在驾驶时就能通过语音指令得到实现,从而规避一些安全问题的出现。

结语

五台手机“群殴”一台“智能”汽车,结果如何?想必看完对比后大家心里已经有了答案。

语音操作让驾驶安全性大大提高

对于智能手机一方,强悍的性能,丰富的扩展能力和复杂的指令支持,足以在功能方面“痛扁”车载语音。而车载语音虽然存在无法语音唤醒、加载地图慢和资源不丰富等各种问题,但其高度集成车辆控制,使得用户可以在一些场景真正做到专注驾驶,也算是车载语音对旗舰机们的一次强力“回击”。

语音操作和驾驶的结合无疑是未来驾驶的一个趋势,5G时代即将来临,未来手机智能助手和车载语音又会出现怎样的新变化,我们十分期待。

本文由betway必威登录平台发布于互联网农业,转载请注明出处:新人机联作本领现身:“语音助手” 专门项目唤

Ctrl+D 将本页面保存为书签,全面了解最新资讯,方便快捷。