智慧城市网

登录

可识别“主人” 语音助手智能化升级

来源:中国智能制造网
2018/9/10 16:04:1235318
  【中国安防展览网 智能家居】 日前,美国及商标局披露的一项来自苹果的新表明,Siri 未来或许将可以分辨不同用户的声音,并提供更为个性化的响应。用户可以通过一些设定来让它记住自己的声音,并根据不同的声音给出不同的反馈。
 
  这样一来就可以让使用语音助手的人的信息更安全。使用过siri的人都知道,siri一般系统默认为一个使用者,它无法分辨是不是主人在发送指令,就会造成,当陌生人拿到主人手机时,很容易通过siri语音助手获取手机里的隐私,比如让siri读个短信什么的。
 
  近几年语音助手发展的很快,在很多手机里都会有这一款应用。通过智能对话与即时问答的智能交互,实现帮忙用户解决问题,主要是帮忙用户解决生活类问题。苹果手机中的siri开创了智能语音助手的先河,随后各个语音助手也如雨后春笋般蓬勃发展。
 
  那么实现语音助手的功能主要是依靠哪些技术呢?语音助手背后的技术由三大块组成:语音识别(Auto Speech Recognition)、语义理解(Semantic Understanding)以及语音合成(Text To Speech)。
 
  首先是语音识别,就是将用户说的话收集起来,再转化为文字。语义理解就是需要对这些文字进行理解和分析,了解用户的意图,再根据这些意图得出相应的应对文字。语音合成就是后再将这些文字,通过语言说出来,以完成对用户的应答。
 
  这三种技术相互支持,共同实现虚拟语音服务。当前,在这三种技术中,语音识别技术还不能算。虽然机器学习使语音识别技术的发展突飞猛进,但是随着用户量的增加,越来越多的问题开始逐渐显现。
 
  其中明显的就是语音识别技术会受到使用者口音的影响。当前各语音库中,可能已经存了很多语言,英语,法语、日语、普通话等等,但是却忽略了用户的口音问题,用户的口音不同,直接影响了识别的准确率。华盛顿邮报近进行的一项研究结果显示,谷歌和亚马逊研发的流行智能语音助手识别非美国本地口音的准确率要比美国本地口音低30%。
 
  为了解决这个问题,很多公司都在积极努力研发新的产品。其中语音识别系统Global English就可以用于解决口音问题对识别的干扰。这个系统拥有40多个国家的数千小时的语音数据和数百亿单词,支持所有英语口音的语音文本转换功能。
 
  除此之外,还有Nuance语音识别系统,它收集了20个特定方言区域的语音和文本数据,包括每种方言*的单词及其发音。它还可以根据用户的口音在几种不同的方言中自动切换,极大地提高了准确率。
 
  但是因为世界语言之复杂多样,想要真正解决口音问题不是一朝一夕的事情,需要更多的用户使用语音识别系统,存储更多的数据到语料库,语言模型也才会越来越多,语音识别系统的准确率才会越高,这是一个不断提升的过程。

上一篇:2022年智能家居市场规模将达534.5亿美元

下一篇:老龄化进程加速 智能家居为养老助力

相关资讯:

首页|导航|登录|关于本站|联系我们