[发明专利]语音服务器及其语音处理方法有效

专利信息
申请号: 201310055270.8 申请日: 2013-02-21
公开(公告)号: CN103151045A 公开(公告)日: 2013-06-12
发明(设计)人: 李晓鹏;潘年华;靳国文;王海;周平;晏利平;罗光喜;杨通涛;罗洋;彭佳琦;袁孟全;张云 申请(专利权)人: 贵阳朗玛信息技术股份有限公司
主分类号: G10L19/008 分类号: G10L19/008;H04H60/04
代理公司: 暂无信息 代理人: 暂无信息
地址: 550022 贵州省贵阳*** 国省代码: 贵州;52
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 语音 服务器 及其 处理 方法
【说明书】:

技术领域

发明涉及网络技术领域,尤其涉及一种语音服务器及其语音处理方法。

背景技术

现有的语音主要有混音和透传两种处理方式,而且在同一语音处理系统中,大多只采用单一的处理方式来处理所有的语音,处理方式固定。由于固定的处理方式大多只针对常见的一般情况进行折中考虑,因此容易导致在某些情况下处理效果的不佳,例如在一个网络聊天室系统中,语音服务器通常采用混音的方式处理混音数据,然而,即使该聊天室中只有固定的一或两个用户聊天时,采用的还是固定的混音方式,对有些可以直接通过透传方式处理的语音还是采用固定的混音的处理机制进行处理,由于混音操作复杂,从而造成某些语音数据传输的时延大,且对服务器增加了不必要的开销。而且当网络聊天室用户的上麦用户在两个以上时,由语音服务器以透传方式处理语音,并由目的客户端进行混音处理,也可以在确保用户体验的前提下优化语音服务器及其客户端的资源配置。

发明内容

本发明的主要目的在于公开一种语音服务器及其语音处理方法,以灵活地处理多情况下的语音。

为达上述目的,本发明公开了一种语音处理方法,应用于聊天室的语音服务器侧,包括以下步骤:

将上麦用户数分成至少三个不同的区段,并对应上麦用户数的不同区段设置不同的语音处理方式,所述语音处理方式至少包括透传、混音和半透传半混音三种方式;

根据所述上麦用户数区段的变化动态切换语音处理方式。

可选的,上述根据所述上麦用户数区段的变化动态切换语音处理方式包括:

设置切换语音处理方式的第一及第二阈值;以及

当所述上麦用户数小于所述第一阈值时,所述语音服务器以透传的方式处理所述聊天室的所有语音数据;

当所述上麦用户数大于或等于所述第一阈值且小于所述第二阈值时,所述语音服务器以半透传半混音的方式处理所述聊天室中的语音数据,即以透传方式处理上麦用户之间的语音数据,并将所有麦上的语音数据混音后发送给聊天室中的其它旁听用户;

当所述上麦用户数大于或等于所述第二阈值时,所述语音服务器以混音的方式处理所述聊天室中的语音数据。

为达上述目的,本发明还公开一种与上述处理方法相对应的语音服务器,包括:

与透传模块、混音模块和半透传半混音模块建立通信连接的切换模块,用于获取上麦用户数,判断上麦用户数所处的切换语音处理方式的区段,并针对上麦用户数的不同区段的动态变化调用相应的透传模块、混音模块或半透传半混音模块以相应的透传、混音或半透传半混音方式处理语音。

可选的,上述切换模块包括:

设置单元,用于设置切换语音处理方式的第一及第二阈值;

切换单元,用于获取当前的上麦用户数,根据上述设置单元设置的第一和第二阈值判断该上麦用户数所处的切换语音处理方式的区段;当所述上麦用户数小于所述第一阈值时,触发所述透传模块以透传的方式处理所述聊天室的所有语音数据;当所述上麦用户数大于或等于所述第一阈值且小于所述第二阈值时,触发所述半透传半混音模块以半透传半混音的方式处理所述聊天室中的语音数据,即以透传方式处理上麦用户之间的语音数据,并将所有麦上的语音数据混音后发送给聊天室中的其它用户;以及当所述上麦用户数大于或等于所述第二阈值时,触发所述混音模块以混音的方式处理所述聊天室中的语音数据。

与现有技术相比,本发明实施例至少具有以下优点:

可以根据上麦用户数区段的变化动态切换语音处理方式,实现了各情况下语音的灵活处理,减少服务器混音操作的开销。

附图说明

图1是本发明实施例公开的语音处理方法的流程图;

图2是本发明实施例公开的语音服务器的功能结构框图。

具体实施方式

下面结合说明书附图对本发明的具体实现方式做一详细描述。

实施例一

本实施例公开一种语音的处理方法,应用于聊天室的语音服务器侧,如图1所示,包括以下步骤:

步骤S1、将上麦用户数分成至少三个不同的区段,并对应上麦用户数的不同区段设置不同的语音处理方式,所述语音处理方式至少包括透传、混音和半透传半混音三种方式。本发明中,所谓上麦用户即指打开麦克风、建立有向语音服务器输送音频数据通道的用户。

在该步骤中,所谓半透传半混音方式是指透传方式处理上麦用户之间的语音数据,并将所有麦上的语音数据混音后发送给聊天室中的其它用户,值得说明的是,该方式中“半”的理解不应狭义的限制在1/2,而应做广义的“一部分”理解,后续不再赘述。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于贵阳朗玛信息技术股份有限公司,未经贵阳朗玛信息技术股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201310055270.8/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top