起订量:
免费会员
GC-2910S:AI语音识别系统管理软件
AI语音识别系统需要解决语音转换成文字的问题。机器语音识别技术是一种实现从“声音”到“文字”转换的技术,通过将人的语音直接转换成相应的文本。传统的语音识别技术主要用于解决人与机器的交互问题,而在会议、咨询、直播等场景需要转成文字的音频内容是人与人之间交互,所以AI会议语音识别系统提供的以下核心功能是基于AI语音识别技术构建的语音转写引擎。
核心功能:
系统架构:采用BS架构,国产Linux系统;
分布式采集:支持跨会议室,跨区域实时分布式采集语音;
分布式显示:支持跨会议室,跨区域实时显示语音识别内容;
高频词汇优先:一场会议中经常会出现频次较多的热词和同声词,通过高频词优化,可有效提高高频词汇识别率。
敏感词汇报警:针对特殊行业,可选择敏感词汇报警,提醒工作人员关注交流、协同内容。
禁忌词屏蔽:语音识别过程中遇到禁忌词,系统自动过滤处理;后台可以自助添加禁忌词。
语音合成:支持主流音频文件的离线语音识别,具有多任务批处理识别能力。
合成播报:支持主流文件导入后的语音合成,提供不同声音音库。
多模式转写:实时会议下,支持单人发言和多人发言显示模式,用户可根据会议类型、会议场合,自由切换显示模式。
人员识别:通过系统对接,语音识别系统自动分离参会人员,文件中可以清晰查看参会人员识别结果。
声纹识别:支持系统采集参会人员声纹信息,开会过程中通过声纹信息做角色分离。
会议字幕:对于新闻发言、大型会议、发布会等场景,提供会议字幕功能。
记录存档:后台自动保存过程录音文件和语音识别文件。
文件下载:系统可选择性帐号下载音频或识别文件。
在线升级:提供软件在线升级服务,可更新软件固件版本。
语气词过滤:支持在语音识别的过程中屏蔽语气词汇,以保证文稿的规整;语气词可在后台自助添加。
定点定时回听:可定时定点回听录音,更改识别文件。