[发明专利]会议信息处理方法、装置、电子设备及存储介质在审
| 申请号: | 202111135941.2 | 申请日: | 2021-09-27 |
| 公开(公告)号: | CN113971955A | 公开(公告)日: | 2022-01-25 |
| 发明(设计)人: | 鄢发鹏;李慧凤;焦文文 | 申请(专利权)人: | 北京百度网讯科技有限公司 |
| 主分类号: | G10L15/26 | 分类号: | G10L15/26;H04M3/56;G06F40/189 |
| 代理公司: | 北京鸿德海业知识产权代理有限公司 11412 | 代理人: | 谷春静 |
| 地址: | 100085 北京市*** | 国省代码: | 北京;11 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 会议 信息处理 方法 装置 电子设备 存储 介质 | ||
1.一种会议信息处理方法,包括:
获取接入会议的客户端的音频流;
将不同客户端的音频流混合成单路音频,写入会议录音文件;
针对任一客户端,分别进行以下处理:获取所述客户端的音频流的语音识别结果,并获取会议录音文件的大小与理论大小之间的差别,根据所述差别将所述语音识别结果中的语音识别文本与所述会议录音文件进行对齐。
2.根据权利要求1所述的方法,其中,所述获取所述客户端的音频流的语音识别结果包括:
为所述客户端建立与自动语音识别系统之间的长连接;
将所述客户端的音频流通过所述长连接发送到所述自动语音识别系统,并获取所述自动语音识别系统返回的所述语音识别结果。
3.根据权利要求2所述的方法,其中,
所述语音识别结果中还包括:所述语音识别文本中的对齐对象的时间戳,所述时间戳为所述对齐对象对应的音频的开始处相对于所述长连接的建立时间的时间偏移量,所述对齐对象包括至少以下之一:句子、字、词语;
所述根据所述差别将所述语音识别结果中的语音识别文本与所述会议录音文件进行对齐包括:针对任一对齐对象,分别根据所述差别、所述会议的开始时间、所述长连接的建立时间以及所述对齐对象的时间戳,确定出所述对齐对象在所述会议录音文件中的对应位置。
4.根据权利要求1、2或3所述的方法,其中,所述获取会议录音文件的大小与理论大小之间的差别包括:
获取当前时间与所述会议的开始时间之间的第一差值;
获取所述第一差值与预先设定的常量之间的第一乘积,所述常量表示每毫秒音频录制的文件大小;
获取所述第一乘积与所述会议录音文件的大小之间的第二差值,将所述第二差值作为所述会议录音文件的大小与理论大小之间的差别。
5.根据权利要求3所述的方法,其中,所述针对任一对齐对象,分别根据所述差别、所述会议的开始时间、所述长连接的建立时间以及所述对齐对象的时间戳,确定出所述对齐对象在所述会议录音文件中的对应位置包括:
获取所述长连接的建立时间与所述会议的开始时间之间的第三差值;
获取所述第三差值与所述常量之间的第二乘积;
获取所述对齐对象的时间戳与所述常量之间的第三乘积;
获取所述第二乘积、所述第三乘积以及所述差别的相加之和,得到所述对齐对象对应的文件偏移量;
根据所述文件偏移量确定出所述对齐对象在所述会议录音文件中的对应位置。
6.根据权利要求3所述的方法,还包括:
当任一客户端出现异常时,断开所述客户端对应的长连接,当所述客户端恢复正常后,重新为所述客户端建立长连接,并利用重新建立的长连接的建立时间更新之前的建立时间。
7.一种会议信息处理装置,包括:获取模块、混音模块以及对齐模块;
所述获取模块,用于获取接入会议的客户端的音频流;
所述混音模块,用于将不同客户端的音频流混合成单路音频,写入会议录音文件;
所述对齐模块,用于针对任一客户端,分别进行以下处理:获取所述客户端的音频流的语音识别结果,并获取会议录音文件的大小与理论大小之间的差别,根据所述差别将所述语音识别结果中的语音识别文本与所述会议录音文件进行对齐。
8.根据权利要求7所述的装置,其中,
所述对齐模块为所述客户端建立与自动语音识别系统之间的长连接,将所述客户端的音频流通过所述长连接发送到所述自动语音识别系统,并获取所述自动语音识别系统返回的所述语音识别结果。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京百度网讯科技有限公司,未经北京百度网讯科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111135941.2/1.html,转载请声明来源钻瓜专利网。





