[发明专利]一种语音会议纪要的分类方法、设备和系统有效
申请号: | 201210499273.6 | 申请日: | 2012-11-29 |
公开(公告)号: | CN102968991A | 公开(公告)日: | 2013-03-13 |
发明(设计)人: | 詹五洲 | 申请(专利权)人: | 华为技术有限公司 |
主分类号: | G10L17/14 | 分类号: | G10L17/14 |
代理公司: | 北京中博世达专利商标代理有限公司 11274 | 代理人: | 申健 |
地址: | 518129 广东*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 语音 会议纪要 分类 方法 设备 系统 | ||
技术领域
本发明涉及通信领域,尤其涉及一种语音会议纪要的分类方法、设备和系统。
背景技术
随着视频会议技术的飞速发展,类似于普通会议开会过程中人工产生会议记录,在多点视频会议中,也同样存在会议纪要的需求。现有产品已经可以实现在视频会议过程中自动记录整个会议的音视频、数据等内容,如果只是对音频数据单纯的记录下来,当对会议的重点内容或者特定内容进行回顾时,就无法达到普通会议那种可以按发言人进行分类的会议纪要整理需求。
在视频会议进行中,如果可以确定整个语音文件只有一个人在讲话,就可以直接将整个文件的语音数据发送至声纹识别系统进行识别。如果语音文件中有多个人的语音,则需要先对语音文件进行分段,然后对每段语音数据分别进行声纹识别。现有的声纹识别系统,通常需要10秒以上的语音数据,数据越长,准确度越高。因此,在对语音数据进行分段时,段不能太短。由于在视频会议中,自由交谈的场景较多,因此当对语音数据的分段较长时,一段语音可能包含多个人的语音,在将这多个人的语音数据段送到声纹识别系统进行识别时,识别结果将是不可靠的。
发明内容
本发明的实施例提供一种语音会议纪要的分类方法、设备和系统,能够将会场中的语音数据按照说话人的方位分别进行声纹识别,提高了声纹识别准确率,进而提高了语音会议纪要分类的可靠性。
为达到上述目的,本发明的实施例采用如下技术方案:
第一方面,提供一种语音会议纪要的分类方法,包括:
根据会场的音频数据进行声源定位,以获取所述音频数据所对应的声源的方位,并将所述声源的方位写入所述音频数据的附加域信息;
将所述音频数据打包成音频码流,将所述音频码流和所述音频码流的附加域信息发送至录播服务器,以使得所述录播服务器根据所述附加域信息对所述音频数据进行分类。
在一种可能实现的方式中,结合第一方面,在将所述音频数据打包成音频码流,将所述音频码流和所述音频码流的附加域信息发送至录播服务器之前,所述方法还包括:
将语音激活标志写入所述附加域信息,其中所述语音激活标志包括已激活或未激活,以便所述录播服务器在将解码出的音频数据发送至声纹识别系统之前,检测所述音频数据的附加域信息中的语音激活标志,并在语音激活标志为已激活时将所述音频数据发送至声纹识别系统。
在第二种可能实现的方式中,结合第一方面的第一种可能的实现方式,所述将语音激活标志写入所述附加域信息包括:
对所述音频数据进行语音活动侦测处理,以识别所述音频数据是否为语音数据,若所述音频数据为语音数据,则在附加域信息中将语音激活标志写为激活;若所述音频数据不是语音数据,则在附加域信息中将语音激活标志写为未激活。
第二方面,提供一种语音会议纪要的分类方法,包括:
从多点控制单元接收会场的音频码流和音频码流的附加域信息,所述音频码流的附加域信息包括所述音频码流所对应的声源的方位;
将所述音频码流所解码出的音频数据,存储到与所述音频码流所属的会场号以及所述音频码流所对应的声源的方位对应的码流文件中,并将所述码流文件中的音频数据发送至声纹识别系统;
从所述声纹识别系统接收声纹识别结果,所述声纹识别结果包括所述音频数据所对应的声源的方位对应的参会者身份,并将所述音频数据所对应的声源的方位对应的参会者身份写入所述音频码流的附加域信息中。
在第一种可能实现的方式中,结合第二方面,在所述将所述音频码流所解码出的音频数据,存储到与所述音频码流所属的会场号以及所述音频码流所对应的声源的方位对应的码流文件中之后,所述方法还包括:
将所述音频码流的时间信息写入音频码流的附加域信息中,以便当接收到的音频码流为至少两个时,将所述至少两个音频码流按照时间信息进行排序。
在第二种可能实现的方式中,结合第二方面或第二方面的第一种可能实现的方式,将所述码流文件中的音频数据发送至声纹识别系统;从所述声纹识别系统接收声纹识别结果,所述声纹识别结果包括所述音频数据所对应的声源的方位对应的参会者身份,并将所述音频数据所对应的声源的方位对应的参会者身份写入所述音频码流的附加域信息中包括:
将所述码流文件中的第一单位时间内的音频数据发送至声纹识别系统;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华为技术有限公司,未经华为技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201210499273.6/2.html,转载请声明来源钻瓜专利网。
- 上一篇:防腐预埋板
- 下一篇:可方便更换布水管的过滤罐