[发明专利]视频精彩片段检测方法、装置、设备与存储介质在审
申请号: | 202210367471.0 | 申请日: | 2022-04-08 |
公开(公告)号: | CN114821402A | 公开(公告)日: | 2022-07-29 |
发明(设计)人: | 张健;潘滢炜;姚霆 | 申请(专利权)人: | 咪咕文化科技有限公司;中国移动通信集团有限公司;北京京东尚科信息技术有限公司 |
主分类号: | G06V20/40 | 分类号: | G06V20/40;G06K9/62;G06V10/764;G06V10/774 |
代理公司: | 深圳市世纪恒程知识产权代理事务所 44287 | 代理人: | 刘瑞花 |
地址: | 100032 北京市西城区德*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 视频 精彩 片段 检测 方法 装置 设备 存储 介质 | ||
1.一种视频精彩片段检测方法,其特征在于,所述视频精彩片段检测方法包括以下步骤:
获取待检测视频片段;
提取所述待检测视频片段的帧数据;
将所述帧数据输入视频精彩片段检测模型预测所述待检测视频片段的精彩分数,所述视频精彩片段检测模型包括两个互相约束的深度模型;
根据所述精彩分数,确定目标精彩片段。
2.如权利要求1所述的视频精彩片段检测方法,其特征在于,所述将所述帧数据输入视频精彩片段检测模型预测所述待检测视频片段的精彩分数的步骤之前还包括:
获取网络图片,所述网络图片为视频精彩片段检测模型的训练数据;
基于所述网络图片,训练得到所述视频精彩片段检测模型。
3.如权利要求1所述的视频精彩片段检测方法,其特征在于,所述视频精彩片段检测模型包括成对噪声模型和三元组精彩程度模型,所述基于所述网络图片,训练得到所述视频精彩片段检测模型的步骤包括:
基于所述成对噪声模型和所述三元组精彩程度模型,得到所述网络图片的结果噪声分数和结果精彩分数;
基于所述结果噪声分数,分离所述网络图片中的噪声图片;
基于所述分离噪声图片后的网络图片训练得到所述视频精彩片段检测模型。
4.如权利要求3所述的视频精彩片段检测方法,其特征在于,所述基于所述成对噪声模型和所述三元组精彩程度模型,得到所述网络图片的结果噪声分数的步骤包括:
将所述网络图片输入噪声分类器,得到每一张网络图片对应的初始隐形噪声标签,所述初始隐形噪声标签用于标注网络图片是噪声图片还是精彩图片;
根据所述初始隐形噪声标签,将所述网络图片分为相关网络图片和噪声网络图片,并获取所述初始隐性噪声标签对应的初始噪声分数;
将精彩视频帧、非精彩视频帧和所述网络图片输入所述三元组精彩程度模型,得到所述网络图片的初始精彩分数;
将所述初始精彩分数和所述初始噪声分数输入第一公式,得到修正噪声分数;
将所述修正噪声分数、相关网络图片和噪声网络图片输入成对噪声模型训练得到所述网络图片的结果噪声分数。
5.如权利要求3所述的视频精彩片段检测方法,其特征在于,所述基于所述成对噪声模型和所述三元组精彩程度模型,得到所述网络图片的结果精彩分数的步骤包括:
给定所述修正噪声分数,并获取初始精彩分数、精彩片段集合、非精彩片段集合和网络图片集合;
通过所述三元组精彩程度模型获得所述网络图片调整后的结果精彩分数。
6.如权利要求5所述的视频精彩片段检测方法,其特征在于,所述通过所述三元组精彩程度模型获得所述网络图片调整后的结果精彩分数的步骤之后,所述方法还包括:
固定所述三元组精彩程度模型的第一模型参数不变,根据成对深度排序交叉熵铰链损失函数来训练成对噪声模型并更新所述第一模型参数;
固定所述成对噪声模型的第二模型参数不变,根据三元组排序交叉熵铰链损失函数来训练三元组精彩程度模型并更新所述第二模型参数,所述三元组排序交叉熵铰链损失函数包括差额项和排序约束项,所述差额项用于约束精彩片段或网络图片的精彩分数与非精彩片段的精彩分数的差值,所述排序约束项用于约束精彩片段、非精彩片段以及网络图片对应的精彩分数的大小关系;
迭代训练所述三元组精彩程度模型和所述成对噪声模型,直到所述结果噪声分数、所述结果精彩分数、所述第一模型参数和所述第二模型参数都保持不变为止。
7.如权利要求4所述的视频精彩片段检测方法,其特征在于,所述将精彩视频帧、非精彩视频帧和网络图片输入三元组精彩程度模型的步骤之前,所述方法还包括:
获取精彩片段集合和网络图片的深度学习特征向量、精彩片段集合和网络图片集合,所述精彩片段集合和所述网络图片集合标注有类别标签;
计算所述精彩片段集合与所述网络图片集合之间的域间隙;
从所述网络图片中过滤掉所述域间隙高于阈值的类别的网络图片。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于咪咕文化科技有限公司;中国移动通信集团有限公司;北京京东尚科信息技术有限公司,未经咪咕文化科技有限公司;中国移动通信集团有限公司;北京京东尚科信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210367471.0/1.html,转载请声明来源钻瓜专利网。
- 上一篇:光学镜头以及光学镜头模组
- 下一篇:一种同端上下线物料输送系统及方法