[发明专利]会议实现方法、装置、设备和系统、计算机可读存储介质有效
申请号: | 201711482042.3 | 申请日: | 2017-12-29 |
公开(公告)号: | CN108076306B | 公开(公告)日: | 2021-09-17 |
发明(设计)人: | 胡景欣 | 申请(专利权)人: | 中兴通讯股份有限公司 |
主分类号: | H04N7/15 | 分类号: | H04N7/15;G06F40/58 |
代理公司: | 北京品源专利代理有限公司 11332 | 代理人: | 潘登 |
地址: | 518057 广东省深圳市南山*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 会议 实现 方法 装置 设备 系统 计算机 可读 存储 介质 | ||
一种会议实现方法、装置、设备和系统,计算机可读存储介质,该会议实现方法包括:获取终端所在会场的原始语音以及所述原始语音对应的翻译语音,生成多声道音频流,且一个声道对应一种语言类型的音频流;将所述多声道音频流进行编码获得多声道编码包;将所述多声道编码包发送给多点控制单元。本申请提供的方案,将多种语言类型的音频流组成多声道音频流发送给多点控制单元,降低了网络通信量,减少了对资源的占用,提高了通信效率。
技术领域
本发明涉及通信技术,尤指一种会议实现方法、装置、设备和系统、以及一种计算机可读存储介质。
背景技术
在信息交流全球化的今天,视频会议业务应用也越来越广泛,跨地区化交流不断增多,多国多地区使用不同语言的人共同交流,实现沟通无障碍化,这对政治、经济、文化各方面的影响都是巨大的。
视频会议是一种多媒体通信手段,可以同时实现两个或多个地点之间的图像、语音和数据的交互功能,利用电视设备和通信网络召开会议。视频会议系统一般由视频终端、传输网络和多点控制单元(Multipoint Control Unit,简称MCU)等几部分组成。视频会议基本的语音业务涉及两个通话方,通话双方可以相互听到对方的声音,而在多方通话的会议业务中,同时通话的可能不止两方,其中任意一方的语音信号够可以被传送至所有其他通话方,而每一通话方都同时可听到多个其他通话方的声音。而当上述多方通话视频会议业务中使用多种语言时,需要对发言者的讲话内容按需进行翻译转换,使参与会议的不同国家不同地区使用不同语言的人能够一起交流,沟通无障碍。
相关技术中,实现多语种视频会议的技术是:各终端能够按照自身的翻译语言类型对会场的原始语音进行翻译,输出两路音频:一路是源语音,一路是翻译语音,需要两个通道传输到MCU,MCU会判断翻译会场上传的翻译后的语音的语言类型,MCU进行混音处理时,需要多个混音器,按照识别的语言类型对翻译语音进行混音以及对原始语音进行混音,在对各语言类型的语音进行混音处理后,针对每一个会场,MCU需发送两路音频数据给会场:一路是各会场原始语音混音,一路是目的会场相应语言类型的翻译混音。上述方案网络通信量比较大,容易造成网络拥塞。
发明内容
本发明至少一实施例提供了一种会议实现方法、装置、设备和系统、计算机可读存储介质,降低网络资源的占用,提高会议效率。
为了达到本发明目的,本发明至少一实施例提供了一种会议实现方法,包括:
获取终端所在会场的原始语音以及所述原始语音对应的翻译语音,生成多声道音频流,且一个声道对应一种语言类型的音频流;
将所述多声道音频流进行编码获得多声道编码包;
将所述多声道编码包发送给多点控制单元。
本发明至少一实施例提供一种会议实现装置,包括:
码流生成单元,设置为,获取终端所在会场的原始语音以及所述原始语音对应的翻译语音,生成多声道音频流,且一个声道对应一种语言类型的音频流;
第一编码单元,设置为,将所述多声道音频流进行编码获得多声道编码包;
第一发送单元,设置为,将所述多声道编码包发送给多点控制单元。
本发明至少一实施例提供一种会议实现方法,包括:
接收参与会议的终端发送的多声道编码包,进行解析获得多声道音频流,其中,所述多声道音频流中每个声道对应一个语言类型的音频流;
确定需要混音的终端,将所确定的终端的多声道音频流中同一语言类型的音频流进行混音,获得多声道混音音频流;
将所述多声道混音音频流进行编码获得多声道混音编码包;
将所述多声道混音编码包发送给参与会议的终端。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中兴通讯股份有限公司,未经中兴通讯股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201711482042.3/2.html,转载请声明来源钻瓜专利网。