[发明专利]一种直播控制方法及装置有效
| 申请号: | 201710538917.0 | 申请日: | 2017-07-04 |
| 公开(公告)号: | CN109218741B | 公开(公告)日: | 2021-10-22 |
| 发明(设计)人: | 毛锋 | 申请(专利权)人: | 阿里巴巴集团控股有限公司 |
| 主分类号: | H04N21/2187 | 分类号: | H04N21/2187;G06N3/04 |
| 代理公司: | 北京安信方达知识产权代理有限公司 11262 | 代理人: | 蒋冬梅;栗若木 |
| 地址: | 英属开曼群岛大开*** | 国省代码: | 暂无信息 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 直播 控制 方法 装置 | ||
1.一种直播控制方法,其特征在于,包括:
从设定时长的真实直播内容中采样得到M帧真实内容,所述M帧真实内容为所述真实直播内容中的M帧内容;
按照分辨率由小到大的顺序,依次确定任一种分辨率下的深度卷积神经网络的输出内容;其中,分辨率Pi下的深度卷积神经网络的输入内容包括:扩展到分辨率Pi的N帧特征内容、缩放到分辨率Pi的M帧真实内容,所述N帧特征内容是分辨率Pi-1下的深度卷积神经网络的输出内容,其中,分辨率Pi大于分辨率Pi-1,i为大于1的整数;分辨率P1下的深度卷积神经网络的输入内容包括:缩放到分辨率P1的M帧真实内容;
根据最大分辨率下的深度卷积神经网络的输出内容,确定N帧预测内容;
根据预测得到的直播内容,执行相应的直播控制操作;
其中,预测网络模型包括多种分辨率下的深度卷积神经网络,N、M均为大于或等于1的整数。
2.根据权利要求1所述的方法,其特征在于,所述预测网络模型是通过优化第一目标函数训练得到的;其中,所述第一目标函数包括以下部分:相似度损失、运动损失以及对抗损失。
3.根据权利要求2所述的方法,其特征在于,一帧真实内容和一帧预测内容之间的运动损失通过以下方式确定:
针对一帧真实内容中的任一像素,根据所述像素与相邻真实内容帧中的邻域像素的L1距离,确定所述像素的真实帧间运动信息;
针对一帧预测内容中的任一像素,根据所述像素与相邻预测内容帧中的邻域像素的L1距离,确定所述像素的预测帧间运动信息;
根据全部像素的真实帧间运动信息和预测帧间运动信息之间的L1距离,确定所述运动损失。
4.根据权利要求2所述的方法,其特征在于,所述对抗损失通过以下方式确定:
采用对抗网络对所述预测网络模型输出的预测内容进行判别,根据判别结果,确定所述对抗损失;
其中,所述对抗网络包括深度卷积神经网络,所述对抗网络的输入包括第一组内容和第二组内容,所述第一组内容为真实内容,若所述第二组内容为预测内容,则所述对抗网络的输出为0,若所述第二组内容为真实内容,则所述对抗网络的输出为1;
所述对抗网络是通过优化第二目标函数训练得到的。
5.根据权利要求4所述的方法,其特征在于,所述方法还包括:通过以下方式训练所述预测网络模型和所述对抗网络:
执行以下步骤直至所述第二目标函数满足收敛条件:
根据真实直播内容、基于所述真实直播内容预测得到的预测内容以及所述对抗网络,计算所述第一目标函数,根据所述第一目标函数的计算结果,更新所述预测网络模型;
基于更新后的预测网络模型,计算所述第二目标函数,根据所述第二目标函数的计算结果,更新所述对抗网络。
6.根据权利要求4所述的方法,其特征在于,所述预测将要发生的直播内容之后,所述方法还包括:
根据预测得到的直播内容以及与所述预测得到的直播内容对应的真实直播内容,计算所述第一目标函数和所述第二目标函数,并更新所述预测网络模型和所述对抗网络;
在所述第二目标函数满足收敛条件时,采用更新后的预测网络模型和对抗网络进行内容预测。
7.根据权利要求1所述的方法,其特征在于,所述根据预测得到的直播内容,执行相应的直播控制操作,包括:
在检测到预测得到的直播内容满足直播控制条件时,执行与所述直播控制条件对应的直播控制操作。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于阿里巴巴集团控股有限公司,未经阿里巴巴集团控股有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710538917.0/1.html,转载请声明来源钻瓜专利网。





