[发明专利]一种基于深度模仿学习的视频通话方法及装置有效

申请号：	201910960211.2	申请日：	2019-10-10
公开（公告）号：	CN110809127B	公开（公告）日：	2021-03-19
发明（设计）人：	周安福;张欢欢;马若暄;苏光远;张新宇;马华东;陈虓将	申请（专利权）人：	北京邮电大学
主分类号：	H04N7/14	分类号：	H04N7/14;H04L12/24
代理公司：	北京柏杉松知识产权代理事务所(普通合伙) 11413	代理人：	马敬;赵元
地址：	100876 ***	国省代码：	北京;11
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	一种基于深度模仿学习视频通话方法装置
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【权利要求书】：

1.一种基于深度模仿学习的视频通话方法，其特征在于，所述方法包括：

针对视频通话的当前传输时隙，获取上一传输时隙的传输信息；所述传输信息包括：传输层信息和应用层信息；

将所述传输信息输入码率优化网络模型，得到当前传输时隙的传输码率；所述码率优化网络模型是根据训练集训练得到的模型，所述训练集包括：样本视频通话中各个传输时隙的真实传输信息和真实传输码率；

基于当前传输时隙的传输码率，向接收端发送视频通话数据；

所述码率优化网络模型按照如下方法训练：

获取预设的神经网络模型和所述训练集；

将预设数量个第一传输时隙的传输信息输入所述神经网络模型，得到所述预设数量个第二传输时隙的传输码率；所述第一传输时隙为所述第二传输时隙的上一传输时隙；

根据得到的第二传输时隙的传输码率和所述样本视频通话中各个传输时隙的传输信息中的真实传输码率，以及预设的损失函数，确定针对传输码率的损失值；

根据所述损失值确定所述神经网络模型是否收敛；

若否，则调整所述神经网络模型中的参数值，并返回所述将预设数量个第一传输时隙的传输信息输入所述神经网络模型的步骤；

若是，则将当前的神经网络模型确定为码率优化网络模型；

所述损失函数为：

其中，表示所述神经网络模型输出的当前传输时隙的传输码率的总损失值，s_t表示当前传输时隙，π_θ(s_t)表示所述神经网络模型输出的当前传输时隙的传输码率，π^*(s_t)表示所述训练集中包含的当前传输时隙的真实传输码率，l(π_θ(s_t),π^*(s_t))表示所述神经网络模型输出的当前传输时隙的传输码率的第一损失，w(s)表示权重函数，H(π_θ(s_t),π^*(s_t))表示交叉熵损失，λ表示预设叠加权重，C表示预设常数，||π_θ(s_t)-φ(t,k)||表示所述神经网络模型输出的当前传输时隙的传输码率的第二损失，φ(t,k)表示在当前传输时隙之前k个传输时隙的传输码率的加权值，s_t-i表示与当前传输时隙相邻i个传输时隙的历史传输时隙，k表示预设时隙数目。

2.根据权利要求1所述的方法，其特征在于，所述传输层信息包括丢包率和包间延迟，所述应用层信息包括传输码率和吞吐量。

3.根据权利要求2所述的方法，其特征在于，所述获取上一传输时隙的传输信息，包括：

获取所述码率优化网络模型在上一传输时隙输出的传输码率；

获取所述接收端针对上一传输时隙的反馈信息，基于所述反馈信息确定上一传输时隙的丢包率，包间延迟和吞吐量。

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于北京邮电大学，未经北京邮电大学许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/pat/books/201910960211.2/1.html，转载请声明来源钻瓜专利网。

上一篇：基于深度动态网络的手写体数据分类方法及系统
下一篇：一种LoRa系统的通讯方法

同类专利

专利分类

H 电学

H04 电通信技术
H04N 图像通信，如电视
H04N7-00 电视系统
H04N7-01 .制式的转换
H04N7-015 .高清晰度电视系统
H04N7-025 .用于非图像数据传输系统，例如在电视帧的有效部分的图文传输
H04N7-04 .传送单一电视信号的系统，即由单一载波传送图像和伴音
H04N7-06 .同时传送单一电视信号的系统，即用一个以上载波传送图像和伴音

免登录下载普通用户下载升级VIP会员，免费下载

[发明专利]一种基于深度模仿学习的视频通话方法及装置有效

专利文献下载