[发明专利]一种基于深度模仿学习的视频通话方法及装置有效
申请号: | 201910960211.2 | 申请日: | 2019-10-10 |
公开(公告)号: | CN110809127B | 公开(公告)日: | 2021-03-19 |
发明(设计)人: | 周安福;张欢欢;马若暄;苏光远;张新宇;马华东;陈虓将 | 申请(专利权)人: | 北京邮电大学 |
主分类号: | H04N7/14 | 分类号: | H04N7/14;H04L12/24 |
代理公司: | 北京柏杉松知识产权代理事务所(普通合伙) 11413 | 代理人: | 马敬;赵元 |
地址: | 100876 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 深度 模仿 学习 视频 通话 方法 装置 | ||
1.一种基于深度模仿学习的视频通话方法,其特征在于,所述方法包括:
针对视频通话的当前传输时隙,获取上一传输时隙的传输信息;所述传输信息包括:传输层信息和应用层信息;
将所述传输信息输入码率优化网络模型,得到当前传输时隙的传输码率;所述码率优化网络模型是根据训练集训练得到的模型,所述训练集包括:样本视频通话中各个传输时隙的真实传输信息和真实传输码率;
基于当前传输时隙的传输码率,向接收端发送视频通话数据;
所述码率优化网络模型按照如下方法训练:
获取预设的神经网络模型和所述训练集;
将预设数量个第一传输时隙的传输信息输入所述神经网络模型,得到所述预设数量个第二传输时隙的传输码率;所述第一传输时隙为所述第二传输时隙的上一传输时隙;
根据得到的第二传输时隙的传输码率和所述样本视频通话中各个传输时隙的传输信息中的真实传输码率,以及预设的损失函数,确定针对传输码率的损失值;
根据所述损失值确定所述神经网络模型是否收敛;
若否,则调整所述神经网络模型中的参数值,并返回所述将预设数量个第一传输时隙的传输信息输入所述神经网络模型的步骤;
若是,则将当前的神经网络模型确定为码率优化网络模型;
所述损失函数为:
其中,表示所述神经网络模型输出的当前传输时隙的传输码率的总损失值,st表示当前传输时隙,πθ(st)表示所述神经网络模型输出的当前传输时隙的传输码率,π*(st)表示所述训练集中包含的当前传输时隙的真实传输码率,l(πθ(st),π*(st))表示所述神经网络模型输出的当前传输时隙的传输码率的第一损失,w(s)表示权重函数,H(πθ(st),π*(st))表示交叉熵损失,λ表示预设叠加权重,C表示预设常数,||πθ(st)-φ(t,k)||表示所述神经网络模型输出的当前传输时隙的传输码率的第二损失,φ(t,k)表示在当前传输时隙之前k个传输时隙的传输码率的加权值,st-i表示与当前传输时隙相邻i个传输时隙的历史传输时隙,k表示预设时隙数目。
2.根据权利要求1所述的方法,其特征在于,所述传输层信息包括丢包率和包间延迟,所述应用层信息包括传输码率和吞吐量。
3.根据权利要求2所述的方法,其特征在于,所述获取上一传输时隙的传输信息,包括:
获取所述码率优化网络模型在上一传输时隙输出的传输码率;
获取所述接收端针对上一传输时隙的反馈信息,基于所述反馈信息确定上一传输时隙的丢包率,包间延迟和吞吐量。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京邮电大学,未经北京邮电大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910960211.2/1.html,转载请声明来源钻瓜专利网。