语音识别技术颠覆传统 备受智能产业关注
- 来源:中国证券网
- 2016/6/24 10:14:1314642
新一代人机交互模式
“语音交互有望成为下一代人机交互的新模式。”美国大的风险投资基金Kleiner Perkins Caufield&Byers(KPCB)合伙人玛丽·米克尔认为,语音是有效的计算输入形式。语音可以快速沟通,简单方便,个性化并且无需键盘。随着技术不断成熟,语音交互时代即将到来。
事实上,语音交互技术已在逐步商用,包括苹果手机上的Siri等应用。业内人士介绍,早期苹果公司的Siri等语音助手,主要依赖脚本对话,对特定指令做出应答。但在去年收购VocalI Q技术后,用户可以以会话方式而非过去的提示性语音与设备交互。
亚马逊的Echo音箱热卖,是语音识别技术发展的一个重要标志。该款音响可以根据语音指令回答问题、创建购物清单、播放音乐,甚至还能开关电灯。自2014年发布以来,该款音响累计销量突破300万台,仅今年一季度就超过100万台。同时,第三方开发服务数量近千项,有望成为亚马逊下一个十亿美元的业务。
对于语音识别技术兴起的原因,业内分析师指出,智能手机在去年达到高潮之后,计算机行业需要一个新的触发点。而传统的交互方式难以满足用户需求,以语音交互为基础构成包括图像、体感在内的第三代人机交互模式有望加速启动。
国泰君安分析师认为,深度学习算法大幅提升语音识别正确率。在语音识别率方面,目前百度、谷歌等主流平台在单词语音识别准确率方面都超过了90%,科大讯飞、云知声等智能语音识别企业的识别率都在96%以上。
百度科学家吴恩达指出,如果语音识别准确率从95%上升到99%,使用人数将大幅增加。搜索业务中,五年后至少50%为图像搜索或者语音搜索。
目前语音识别已广泛应用于智能手机。玛丽·米克尔指出,2013年至2015年,美国智能手机用户使用语音助手的比例从30%上升到65%。谷歌2016年语音搜索量较2008年增长了35倍以上,较2010年增加7倍以上。百度语音从2014年第二季度起,语音输入增长4倍以上,输出增长26倍以上。
融合多种人工智能技术
智能语音技术包括识别和交互环节,融合了多种人工智能技术。安信证券分析师指出,人机语音交互应用的关键在于准确率与响应时间,语音识别技术日益成熟,即将突破量变到质变的临界点。语音识别技术和硬件发展,驱动语音交互渗透率迅速提升。
据悉,亚马逊的Echo音箱早只是一个有趣的实验,为的是测试语音激活功能,并希望通过收集消费者的行为数据来制定可行的战略方案,吸引其前往亚马逊网站购物。不过,Echo的销售大超预期。目前苹果、谷歌等已经发布类似产品。科大讯飞去年与京东成立合资公司,切入点正是其新推出的叮咚智能音响。
随着语音技术应用范围不断扩宽,并衍生出一系列对语音交互存在刚性需求的场景。例如,以可穿戴设备为代表的小型化、便携式终端交互;远距离、大屏幕终端交互,包括智能电视、智能家居、消费机器人等;汽车等不方便使用双手场景中的人机交互。
应用需求推动技术进步。智能可穿戴设备屏幕一般不大,甚至没有触控屏幕,因此使用语音更加便利于人机交互。比如,可穿戴设备的谷歌眼镜,就搭载了智能语音系统。在网络环境下,可以通过语音发送短信。随着可穿戴设备渗透率不断提升,语音交互应用领域将不断拓宽。
在大屏领域的应用集中在智能电视,康佳、长虹、TCL、LG、乐视等均搭载语音交互功能,通过语音输入,可以实现查收影视剧、听歌、发送微博、开关电视等功能。在智能家居领域,搭载语音方案成标配。其中,苹果发布的智能家居HomeKit采取与Siri协作的方式,用户可以使用自然语句发出命令。随着家用消费市场兴起,语音技术将迎来更广阔的市场。
汽车领域则是另一争夺焦点。在驾驶汽车过程中,使用按键或触控容易引发安全问题,各大车厂在前装控制系统中均搭载了语音控制方案。
多路资本加快入场
苹果大会6月13日召开,智能家居相关产品将成为焦点。硬件方面,有望推出语音控制智能家居的智能音箱,以及搭载摄像头、支持面部识别的相关产品。软件方面,面向开发人员推出基于Siri的软件开发工具包,实现语音交互、人工智能等功能。
谷歌业已布局声控操作智能家居入口系统,其语音助手基于人工智能和深度学习功能,可应用于多种硬件产品;声控智能硬件产品Google Home有望成为智能家居的控制中枢。
京东发布的叮咚智能音响平台,为基于语音交互控制的智能家居产品,目标是打造家庭全数据服务分发平台。
音响的普及带动了音乐版权落地。安信证券分析师指出,进入数字音乐时代,智能音响满足声音的输出要求。智能语音技术发展逐渐成熟,信息的输入与输出在智能音响上得到诠释,声学将是互联网的新入口,基于声音的商业模式将得到快速发展。
“预计智能音响行业有望成为新的互联网和物联网入口,互联网厂商加速切入,从CES等展会上观察到约三分之一的厂商在布局声学产品。”安信证券分析师指出,音乐支出占娱乐消费的18%,商业模式在数字时代正在变化,内容收费需要与硬件结合。智能音响更多的价值体现在家庭物联网的整合控制和人工智能的实际载体。
硬件将成为入口,软件平台处于产业核心地位。“未来人工智能将像水和电一样,融入人们的生活。”科大讯飞相关负责人表示,公司占有中文语音市场70%以上的份额。公司针对人与人之间自由交流语音的正确率突破85%实用门槛,针对会议演讲等场景达到95%以上的识别率;同时布局了图像识别、大数据以及脑科学等领域。