[发明专利]一种基于深度模仿学习的视频通话方法及装置有效
申请号: | 201910960211.2 | 申请日: | 2019-10-10 |
公开(公告)号: | CN110809127B | 公开(公告)日: | 2021-03-19 |
发明(设计)人: | 周安福;张欢欢;马若暄;苏光远;张新宇;马华东;陈虓将 | 申请(专利权)人: | 北京邮电大学 |
主分类号: | H04N7/14 | 分类号: | H04N7/14;H04L12/24 |
代理公司: | 北京柏杉松知识产权代理事务所(普通合伙) 11413 | 代理人: | 马敬;赵元 |
地址: | 100876 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 深度 模仿 学习 视频 通话 方法 装置 | ||
本发明实施例提供了一种基于深度模仿学习的视频通话方法及装置,方法包括:针对视频通话的当前传输时隙,获取上一传输时隙的传输信息;传输信息包括:传输层信息和应用层信息;将传输信息输入码率优化网络模型,得到当前传输时隙的传输码率;码率优化网络模型是根据训练集训练得到的模型,训练集包括:样本视频通话中各个传输时隙的真实传输信息和真实传输码率;基于当前传输时隙的传输码率,向接收端发送视频通话数据。以实现实时确定视频通话中合适的传输码率,提高视频通话质量。
技术领域
本发明实施例涉及通信技术领域,特别是涉及一种基于深度模仿学习的视频通话方法及装置。
背景技术
随着通信技术的发展,实时视频通话已经成为人们生活中不可缺少的部分。且移动无线网应用,例如众包直播、云视频游戏、机器人技术、车辆远程操作等都不断推动视频通话流量的增长。
然而,现有的视频通话质量仍然不足以让人满意,例如在视频通话过程中,可能出现图像模糊,图像帧丢失,卡顿等问题。
现有的视频通话质量不高的主要原因是:应用层与传输层之间不协调,导致无法确定数据传输时合适的比特率。具体的,传输层通常以毫秒级粒度来更新网络容量估计,以尽可能动态响应网络变化,而应用层的视频编解码器只能在较大时间间隔上更改视频比特率,导致视频编码器无法实时跟随传输层的数据传输速率来调整传输码率。
可见,现有的视频通话技术中由于应用层和传输层之间不协调,无法确定适当的传输特率,从而导致视频通话质量不高。
发明内容
本发明实施例的目的在于提供一种基于深度模仿学习的视频通话方法及装置,以实现实时确定视频通话中合适的传输码率,提高视频通话质量。具体技术方案如下:
为实现上述目的,本发明实施例提供了一种基于深度模仿学习的视频通话方法,所述方法包括:
针对视频通话的当前传输时隙,获取上一传输时隙的传输信息;所述传输信息包括:传输层信息和应用层信息;
将所述传输信息输入码率优化网络模型,得到当前传输时隙的传输码率;所述码率优化网络模型是根据训练集训练得到的模型,所述训练集包括:样本视频通话中各个传输时隙的真实传输信息和真实传输码率;
基于当前传输时隙的传输码率,向接收端发送视频通话数据。
可选的,所述传输层信息包括丢包率和包间延迟,所述应用层信息包括传输码率和吞吐量。
可选的,所述获取上一传输时隙的传输信息,包括:
获取所述码率优化网络模型在上一传输时隙输出的传输码率;
获取所述接收端针对上一传输时隙的反馈信息,基于所述反馈信息确定上一传输时隙的丢包率,包间延迟和吞吐量。
可选的,所述码率优化网络模型按照如下方法训练:
获取预设的神经网络模型和所述训练集;
将预设数量个第一传输时隙的传输信息输入所述神经网络模型,得到所述预设数量个第二传输时隙的传输码率;所述第一传输时隙为所述第二传输时隙的上一传输时隙;
根据得到的第二传输时隙的传输码率和所述样本视频通话中各个传输时隙的传输信息中的真实传输码率,以及预设的损失函数,确定针对传输码率的损失值;
根据所述损失值确定所述神经网络模型是否收敛;
若否,则调整所述神经网络模型中的参数值,并返回所述将预设数量个第一传输时隙的传输信息输入所述神经网络模型的步骤;
若是,则将当前的神经网络模型确定为码率优化网络模型。
可选的,所述损失函数为:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京邮电大学,未经北京邮电大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910960211.2/2.html,转载请声明来源钻瓜专利网。