[发明专利]一种多人语音通信中的语音控制方法及装置有效
申请号: | 201210480451.0 | 申请日: | 2012-11-22 |
公开(公告)号: | CN103024224A | 公开(公告)日: | 2013-04-03 |
发明(设计)人: | 林形省;樊家麟;张鹏飞 | 申请(专利权)人: | 北京小米科技有限责任公司 |
主分类号: | H04M7/00 | 分类号: | H04M7/00 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 100102 北京市朝阳区*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 人语 通信 中的 语音 控制 方法 装置 | ||
技术领域
本发明涉及语音通信技术领域,尤其涉及一种多人语音通信中的语音控制方法及装置。
背景技术
目前,多人语音软件在网络生活中已经被广泛应用于远程会议、游戏团队在线指挥和在线唱歌等各个领域。但是,目前在语音群聊时,如果多人同时说话,整个群聊声音会变得嘈杂,无法分清每个人的声音,整个群聊状态变得不可使用。为了让多人语音群聊具有更好的听觉效果,需要用户手动占用麦克风进行说话,一旦不占用麦克风,则不再上传他的语音数据。但是这需要用户去单独操作,费时费力。
多人语音软件通常都提供给用户一些麦克风的管理方法。但是这些麦克风的管理方法,都需要去和服务器通信,浪费网络流量。同时,由于网络延迟也会造成语音环境不稳定。
一种技术是在语音软件中提供麦克风的管理方法。例如,语音软件将用户分为频道管理员和普通用户,并提供多种通话模式,包括麦序模式,想说话的用户点击发言并轮流说话,每人默认有300秒时间,频道管理员不受此限制;管理员模式,此时只允许管理员讲话,普通会员不能讲话;自由模式,任何人都可以讲话。这种技术的缺点是,在开一个会议需要多人同时讨论的时候,上述方法变得不那么方便,麦序模式和管理员模式都只允许有限的人同时说话,自由模式无法控制同时说话人的数量,会使语音环境嘈杂混乱。
另一种技术是在多人语音软件的服务器端设置同时传递用户声音的最大值,用户想占用麦克风的时候,需要从服务器端获取当前说话人的个数,然后根据当前的说话的人数来判断是否能够占麦发言。这种技术的缺点是用户端每次说话的时候都需要与服务器通信一次,然后再判断当前是否可以通话,如果有网络延迟,还容易造成用户端判断不准确,本来可以上传的语音被服务器抛弃。
发明内容
本发明实施例提供一种多人语音通信中的语音控制方法及装置,用于实时判断用户端当前是否可以占用麦克风发言,不用每次发言之前都与多人语音服务器通信确认是否可以发言,减少网络延迟量,使用户的占麦信息得到实时响应。
本发明的一个方面,提出了一种多人语音通信中的语音控制方法,包括以下步骤:接收多人语音服务器传送的各路语音数据;根据所述各路语音数据确定语音来源数量;根据所述语音来源数量和预设阈值生成控制指令;根据所述控制指令控制是否上传语音数据。采用该技术方案,能够使多人语音通信的用户端在判断能否占麦发言时,不需要通过与多人语音服务器进行通信判定,能够实时判断并进行多人语音通信。
优选的,根据所述各路语音数据确定语音来源数量的步骤包括:对所述语音数据进行噪音分析;如果所述语音数据是语音信息、或语音信息和噪音信息的混合,则语音来源数量增加一个;如果所述语音数据是噪音信息,则语音来源数量不增加。该技术方案通过对语音数据进行噪音分析,能够排除掉纯噪音通话麦路,为其他用户节省麦路语音,提高麦路的使用效率。
优选的,如果所述语音数据包括噪音信息,则过滤所述噪音信息。该技术方案能够使噪音大的麦路通话质量提高,提高多用户通话效果。
优选的,根据所述各路语音数据确定语音来源数量的步骤包括:检测所述语音数据是否来自于语音文件;如果是,则语音来源数量不增加。该技术方案能够根据用户需要使来自于语音文件的通话不占用麦路,节省通话麦路。
优选的,所述如果语音数据来自于语音文件,则过滤所述来自于语音文件的语音信息。该技术方案能够根据用户需要排除掉来自于语音文件的麦路语音数据,提高多人语音通话效果。
优选的,所述根据所述语音来源数量和预设阈值生成控制指令的步骤包括:如果所述语音来源数量小于所述预设阈值,则生成上传语音数据的控制指令;如果所述语音来源数量大于或等于所述预设阈值,则生成不上传语音数据的控制指令。该技术方案能够根据用户需要设定通话人数,通过预设阈值和实时语音来源数量调节多人语音通话的人数,保证多人语音通信的通畅。
本发明的另一个方面,提出了一种多人语音通信中的语音数据控制装置,包括接收模块、分析模块、指令生成模块和控制模块,其中,所述接收模块,用于接收多人语音服务器传送的各路语音数据;所述分析模块,用于根据所述各路语音数据确定语音来源数量;所述指令生成模块,用于根据所述语音来源数量和预设阈值生成控制指令;所述控制模块,用于根据所述控制指令控制是否上传语音数据。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京小米科技有限责任公司,未经北京小米科技有限责任公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201210480451.0/2.html,转载请声明来源钻瓜专利网。
- 上一篇:六氯乙硅烷的合成方法
- 下一篇:一种谐振子、谐振腔、滤波器件及电磁波设备