思正科技:智能语音识别拾音器重磅推出 仍待打破更多技术瓶颈
——专访广州市思正电子科技有限公司技术总监夏雄辉
- 来源:安防展览网
- 2019/11/13 8:47:0072706
【安防展览网 访谈】传统的监控系统大都没有声音,人们只能看到无声的图像,随着安防多维化要求,近年视频监控从“看得见”上升到“看得清”、“听得见”,为音频监控打开了市场并迅速发展成为安防行业重要的一个分支,不断扩大应用。
在音视频监控领域中, 广州市思正电子科技有限公司(以下简称“思正科技”)作为一家专注音频监控研发、以“满足用户需求”为宗旨的企业在刚刚结束的2019深圳安博会上也是备受关注。安博会期间安防展览网也走进思正科技展台,与技术总监夏雄辉就产品亮点、企业服务、行业环境等进行了解。
广州市思正电子科技有限公司技术总监夏雄辉
平安城市解决方案——智能语音识别报警拾音器
通过10年的技术沉淀与积累,思正科技凭借在音频行业的丰富经验,从原有监控音频领域延伸至视频会议系统与智能家居领域,发展成为并驾齐驱的三条主线。
在2019深圳安博会上,思正科技展台繁多的产品中,拾音器仍是当仁不让的主角。此次,思正科技主打的是一款智能语音识别报警拾音器产品。相比传统拾音器在语音识别方面进行了升级,可以对特定敏感词、特殊声音进行远距离识别,在感知到异常情况后时间信息传递给监控云台,发出报警动作,起到预警作用。以监狱应用为例,传统的声音报警是通过人说话的声音强度(也就是分贝)来设定报警警戒线,存在误识别率较高的问题,而思正智能语音识别报警是以非特定的敏感词来进行识别报警(可定制报警词),减少了误报率,同时提高了报警的准确性和优越性。
对于音视频一体化监控来说,摄像机是眼睛,拾音器是耳朵。眼睛看到的图像和耳朵听到的声音通过电缆、光纤、网络等神经系统传输到作为大脑的云台再发出指令完成报警。智能语音识别报警拾音器让整套系统不仅有了眼睛和耳朵,还有了听音识别的能力,为平安城市雪亮工程提供有证可取提前布防的解决方案,完成更的保障。
场景选择多样化 技术瓶颈待突破
在政策支持下,监控拾音器的普及在各行各业铺开,鉴于拾音器的使用场景多样化,思正科技研发了适合银行、监狱、治安监控、公安场景下的高保真拾音器;适用于户外、道路场景下的高降噪数字阵列拾音器等,在服务中基于用户的实际需求推荐不同场景下的佳选择。
尽管思正科技在拾音器领域的成绩突出,推出了许多产品与解决方案,但总结思正科技过去案例应用实施的经验与多款拾音器研发创新的积累,夏雄辉坦言,对噪音的处理目前仍然是音视频领域瓶颈。音频监控技术发展长期面临着噪声处理难度大的问题,虽然随着产品的更新迭代降噪技术不断优化,但是要达到更高要求还任重道远。“有声音的地方就有思正”,思正科技作为行业内音频解决方案的前行者也会在降噪算法中不断发力,打破壁垒。
结语:过去音视频监控结合是以视频监控为主,音频为辅的合作状态,随着音视频同步要求的提高合作关系有所改善。未来,夏雄辉认为,音视频监控的合作将进一步推进,达到音视频的融合,从模拟到数字到平台的实现才是行业方向。