依图发布离线“会议超极本” 强悍AI攻破语音识别难题
- 来源:依图
- 2020/5/29 14:19:5836245
【安防展览网 品牌专栏】 近日,依图科技以“AI赋能,声无界”为主题,*以线上的形式发布了面向实时语音转写市场的重磅产品:依图会议超级本。它能够准确将语音迅速转化为文字,并进行说话人识别和二次编辑,有效提升工作效率。
此次发布的依图“会议超级本”,以强大AI赋能,面向政企市场,以离线、高效、安全、高精度、超准确等特点,有效提升会议语音实时转写的体验和效率。
会议超极本,解决痛点“稳、准、狠”
过去一年,依图科技已经通过语音和声纹能力服务了互联网、金融、运营商、媒体行业逾百家客户;会议,是依图在语音实时转录、转写市场上,为关注的场景之一。
对于经常开会的用户来说,整理会议纪要实在是一件令人头疼的事情,记录员从记录,到复听再到整理,需来回耗时数小时以上才能形成一个完整的文本;当中可能还会存在不少无关内容、语气词、停顿,单靠人工的方式整理纪要耗时耗力,易延误会议精神的传递和执行。
另一方面,根据关键词快速检索和定位重点内容,区分角色查看会议纪录,也正逐渐成为会议场景下的刚需。此外,市面上的录音笔、手机内置应用、转写APP或者电脑软硬件等,面对远场、噪音、穿插多人对话的复杂场景下,存在识别错误率高、不支持离线、实时修改不方便、转写质量不高等诸多问题和短板。同时,如何保障会议纪要的安全,保证内容的不泄漏?也对语音实时转写的规模化应用提出了新的挑战。
而依图此次发布的新品“会议超极本”,通过高精度的算法、先进的自然语言理解技术和声纹识别模型,有效攻克了上述痛点。
就发布会来看,这款“会议超极本”可以说是亮点十足。不同于其他软硬件需要联网使用,它采用依图业内的离线语音识别系统,无需联网也能够进行语音识别,将数据存储于本地的系统,有效保证了不同涉密会议场景的信息安全。
同时,高精度算法、超准确识别的强劲表现也很吸睛,针对性的数据增强训练算法,使得依图会议本可以有效应对常见的重口音、特定专有词识别问题,能准确区分不同说话人,避免内容的混淆。对于语气词和无关停顿可直接过滤,标点及数字符号都能“跃然纸上”,使用体验非常顺滑。
便携、便捷,“拎得清”是另一大特点。这款“会议超极本”仅有17毫米厚,重量仅为1700克,是市面类似产品重量的1/3-1/4,搭配桌面收音设备、领夹蓝牙麦克风等组件,可用于演讲、培训、大会发言等多个场景。
界面简单干净,从开机到开启实时转录,仅需要三次点击即可实现。
该产品还具有逐字回听、二次编辑、文本实时编辑修饰、热词优化、禁忌词屏蔽等功能。在普通话场合下,转写准确率可达98%,远高于同类产品平均水平。此外,在远场、噪音等复杂场景下的识别准确率也大幅同类产品。
这些突出的优势,让依图“会议超极本”获得诸多加分,同时也完美匹配了政府机关、金融、能源、教育等各行各业的线上、线下会议和活动。
开放生态,合作共赢
作为极少数拥有全栈人工智能自研核心技术的企业之一,依图科技在计算机视觉、语音识别、语义理解、智能决策、AI芯片等领域达到了水平。
2018年12月,在图像识别领域获得*成绩之后,依图正式开始深耕语音识别,联合微软Azure推出依图语音开放平台,并携手华为发布了“智能语音联合解决方案”,将语音识别技术提供给广泛的第三方应用开发者。同时也正式树立了全面公开算法 API 接口、公开多样的测试数据集、以及公开可重复的评测结果等三大战略。依图在中文语音识别技术上获得突破性成绩,刷新大开源中文数据库AISHELL-2字错率(CER)记录后,又在2019年刷新VoxSRC世界声纹挑战赛记录。
值得关注的是,在发布“会议超极本”之际,依图科技也再次表明了其“开放生态、合作共赢”的渠道策略和市场态度。面对当下激烈的竞争,群雄并起、逐鹿AI,是产业链各方合作共赢的方式。
未来,依图将通过“依图+X”合作伙伴招募计划,以建设开放、创新、融合的AI生态体系为目标,帮助合作伙伴构建基于开放式AI计算平台的业务实践和解决方案,共建AI多维应用场景,进而实现产业共赢。