[发明专利]一种远程会议语音识别数据传输方法在审
申请号: | 201811323511.1 | 申请日: | 2018-11-08 |
公开(公告)号: | CN109525800A | 公开(公告)日: | 2019-03-26 |
发明(设计)人: | 何镝;诸健文;胡红林;周骋 | 申请(专利权)人: | 江西国泰利民信息科技有限公司 |
主分类号: | H04N7/15 | 分类号: | H04N7/15;H04N21/439;H04N21/4402;G10L15/22;G10L15/26;G10L17/04;G10L17/06;G10L21/0208;G10L21/0216 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 330000 江西省南昌市南昌高新技术产*** | 国省代码: | 江西;36 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 语音识别 扬声器 语音识别服务器 语音处理模块 麦克风阵列 中央处理器 摄像头 存储模块 声纹训练 数据传输 远程会议 终端设备 显示屏 远程视频会议 互联网连接 身份记录 声纹识别 构建 文档 发音 存储 语音 会议 转换 身份 | ||
本发明是一种远程会议语音识别数据传输方法,包括若干个参会终端设备,每个参会终端设备包括麦克风阵列、摄像头、wifi模块、语音处理模块、声纹训练模块、存储模块、语音识别服务器、中央处理器、扬声器和显示屏,所述语音处理模块分别连接声纹训练模块和麦克风阵列,所述中央处理器分别连接存储模块、摄像头、wifi模块、扬声器和显示屏,所述Wifi模块通过互联网连接语音识别服务器。本发明不仅构建了远程视频会议,还通过语音识别将会议上发言人的语音进行处理,并转换成文档进行存储,通过声纹识别确认发音人的身份,并对会议中不同的发言人进行身份记录。
技术领域
本发明涉及智能办公技术领域,具体涉及一种远程会议语音识别数据传输方法。
背景技术
远程视频会议系统是一种在位于两个或多个地点的多个用户之间提供语音和运动彩色画面的双向实时传送的视听会话型会议业务。大型远程视频会议系统在政府、企业、医疗等方面有广泛的应用。
传统的视频会议系统可以满足基本的远程视频会议要求,解决空间以及时间对会议的限制,但是部分重要的远程视频会议需要对会议内容进行记录,因为对于重要会议的内容需要进行记录与总结,在工作过程中需要对会议内容进行回顾调阅,视频可以录制,但是把一个会议视频全部看完耗时耗力,无法准确的定位关键会议内容,且保存视频耗费大量内存。如果通过人工方式进行记录,可能在记录内容上有所缺失或者不够完善。
语音识别技术是通过将语音指令或语音转换成计算机可识别的信息进行一系列交互处理的技术。
本发明提供一种远程会议语音识别数据传输方法,采用基于语音识别的多人远程会议记录系统,在远程会议的过程中分角色的进行会议内容记录,并生成完整的全过程的会议文档,方便之后的查阅,并且较小体积的文档基本不占用内存,节省硬件资源和人力资源。
发明内容
本发明的目的在于克服现有技术存在的问题,提供一种远程会议语音识别数据传输方法,通过语音识别将会议上发言人的语音进行处理,并转换成文档进行存储,通过声纹识别确认发音人的身份,并对会议中不同的发言人进行身份记录。
为实现上述技术目的,达到上述技术效果,本发明通过以下技术方案实现:
一种远程会议语音识别数据传输方法,包括若干个参会终端设备,每个参会终端设备包括麦克风阵列、摄像头、wifi模块、语音处理模块、声纹训练模块、存储模块、语音识别服务器、中央处理器、扬声器和显示屏,所述语音处理模块分别连接声纹训练模块和麦克风阵列,所述中央处理器分别连接存储模块、摄像头、麦克风阵列、wifi模块、扬声器和显示屏,所述Wifi模块通过互联网连接语音识别服务器,该方法包括构建远程视频会议和生成会议记录文档,其中,
构建远程视频会议包括以下步骤:
步骤1.1)多个参会终端设备同步运行,打开显示屏,并开启摄像头和麦克风阵列分别对现场会议视频和音频进行拾取;
步骤1.2)摄像头捕捉视频画面传送到对应参会终端设备的中央处理器进行编解码,麦克风阵列搜集语音,一份传送至对应参会终端设备的中央处理器进行编解码,另一份传送至语音处理模块进行声纹特征对比以及降噪去回音;
步骤1.3)参会终端设备的中央处理器将编解码后的视频画面和语音通过wifi模块连接互联网传送至其它参会终端设备进行解码,解码后的视频画面通过显示器显示,解码后的语音通过扬声器播放,实现远程视频会议;
生成会议记录文档包括以下步骤:
步骤2.1)语音处理模块对步骤1.2)中传输来的语音流进行声纹特征对比、降噪、去回声处理,声纹训练模块从语音处理模块调用处理过的语音流进行处理并返回给语音处理模块建立声纹角色数据库;
步骤2.2)语音处理模块将处理后的语音流通过wifi模块上传至语音识别服务器进行识别转码,并生成会议记录文档;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于江西国泰利民信息科技有限公司,未经江西国泰利民信息科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811323511.1/2.html,转载请声明来源钻瓜专利网。