[发明专利]一种音频处理方法、终端设备及系统无效

专利信息
申请号: 201110201927.8 申请日: 2011-07-19
公开(公告)号: CN102890936A 公开(公告)日: 2013-01-23
发明(设计)人: 李众庆 申请(专利权)人: 联想(北京)有限公司
主分类号: G10L21/0308 分类号: G10L21/0308;G10L25/24;G10L15/20
代理公司: 北京集佳知识产权代理有限公司 11227 代理人: 陈蕾;逯长明
地址: 100085 北京市*** 国省代码: 北京;11
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 音频 处理 方法 终端设备 系统
【说明书】:

技术领域

本申请涉及语音通信技术领域,特别是涉及一种音频处理方法、终端设备及系统。

背景技术

现有电话会议系统中,包括多个具有麦克的终端设备,这些终端设备接入通信网络中,比如PSTN(Public Switched Telephone Network,公共交换电话网),IP(Internet Protocol,互联网协议)网络等。以三方电话会议为例,其中一方终端设备只需要提供两条线路就可以把其它两个终端设备联系在一起,实现三方通话。目前最常见的方式是交换机提供三方通话功能,或者运营商提供多方电话会议桥接服务,使得身处不同地方的人能够克服地理位置或距离上困难,同时连接到会议系统中一起说话讨论,彼此能听到对方说话,就好像在同一个屋子里开会一样。

但是,发明人在对现有技术的研究过程中发现,对于一方终端设备侧的用户来说,当多个人同时参与会议时,多个语音信息将进行混音后,通过连接线路在终端上进行统一播放,经常有听不清楚的情形,尤其是多个人同时说话的时候,一方面是由于电话线路有信号不好或者干扰等原因,另一方面是发言者距离麦克风的距离不同导致拾入的信号强弱不齐,加上多个人的声音同时响起,要让对方听清楚非常困难,为了解决这个问题,电话会议系统中,会议主持人经常会让单个人发言,但这显然降低了效率。与现场会议不同,现场会议中每个人除了通过识别不同人的音调和音质以外还可以通过声音发出的方位判断所要获取的声音信息,而对于电话会议,所有语音信息统一混音后,接收到该混音信息的终端通过扬声器对其进行统一播放,因此难以听清其中声音较小的语音信息,如果将混音放大,则只能将所有声音同一放大,因此仍然难以分辨单个语音信息。

发明内容

本申请实施例提供了一种音频处理方法、终端设备及系统,以解决现有技术中难以分辨混音音频中的单个语音信息,导致收听方分辨效果不佳的问题。

为了解决上述技术问题,本申请实施例公开了如下技术方案:

一种音频处理方法,应用于具有至少两个音频通道的第一终端设备中,所述第一终端设备与至少一个第二终端设备连通,所述方法包括:

接收所述至少一个第二终端设备通过一条传输通道传输的混音音频,所述混音音频中包含混合在一起的至少两个音频信息;

对所述混音音频进行分离,获得所述混音音频中的至少一个独立的音频信息;

至少将分离出的一个所述独立的音频信息通过一个音频通道输出。

所述对混音音频进行分离包括:

获取预先设置的分离矩阵,所述分离矩阵为由每个音频信息的特征向量组成的矩阵;

根据所述分离矩阵,通过快速独立成分分析算法ICA从所述混音音频中分离出独立的音频信息。

所述对混音音频进行分离后还包括:

判断分离出的每个独立的音频信息是否为噪音;

根据判断结果,将为噪音的音频信息进行过滤。

还包括:

将分离出的多个独立的音频信息采用时分复用的方式通过少于所述音频通道数量的扬声器进行播放。

还包括:

获取所述混音音频的平均音量;

根据所述平均音量调整通过所述一个音频通道输出的所述分离出的一个独立的音频信息的音量大小。

还包括:

对所述分离出的一个所述独立的音频信息进行声纹检测,获得声纹特征;

分配用于输出与所述声纹特征对应的音频信息的音频通道。

一种终端设备,所述终端设备作为第一终端设备,与至少一个第二终端设备连通,所述第一终端设备具有至少两个音频通道,所述第一终端设备包括:

接收单元,用于接收所述至少一个第二终端设备通过一条传输通道传输的混音音频,所述混音音频中包含混合在一起的至少两个音频信息;

分离单元,用于对所述混音音频进行分离,获得所述混音音频中的至少一个独立的音频信息;

输出单元,用于至少将分离出的一个所述独立的音频信息通过一个音频通道输出。

所述分离单元包括:

矩阵获取单元,用于获取预先设置的分离矩阵,所述分离矩阵为由每个音频信息的特征向量组成的矩阵;

音频分离单元,用于根据所述分离矩阵,通过快速独立成分分析算法ICA从所述混音音频中分离出独立的音频信息。

还包括:

判断单元,用于判断分离出的每个独立的音频信息是否为噪音;

过滤单元,用于根据所述判断单元的判断结果,将为噪音的音频信息进行过滤。

还包括:

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于联想(北京)有限公司,未经联想(北京)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201110201927.8/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top