[发明专利]一种视频处理的方法和装置有效
| 申请号: | 201810538414.8 | 申请日: | 2018-05-30 |
| 公开(公告)号: | CN108881950B | 公开(公告)日: | 2021-05-25 |
| 发明(设计)人: | 马龙飞 | 申请(专利权)人: | 北京奇艺世纪科技有限公司 |
| 主分类号: | H04N21/234 | 分类号: | H04N21/234;H04N21/44;H04N21/84;H04N21/8405 |
| 代理公司: | 北京润泽恒知识产权代理有限公司 11319 | 代理人: | 莎日娜 |
| 地址: | 100080 北京市海淀*** | 国省代码: | 北京;11 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 视频 处理 方法 装置 | ||
本发明实施例提供了一种视频处理的方法和装置,所述方法包括:获取目标视频数据;从所述目标视频数据中,确定一组或多组第一相似帧,并确定每组第一相似帧对应的第一整体特征向量;将所述第一整体特征向量输入预先建立的数据模型,并接收所述数据模型针对所述目标视频数据输出的内容描述信息。通过本发明实施例,实现了基于图像特征,自动生成视频的内容描述,提升了内容描述生成的效率,减少了人力成本。
技术领域
本发明涉及视频处理技术领域,特别是涉及一种视频处理的方法和装置。
背景技术
随着互联网技术的发展,电视剧、电影等视频资源越来越多,且部分视频资源的篇幅较长,用户若完整观看需要花费用户大量的时间。
目前,对于没有时间观看视频,或者,不想完整观看视频的用户,通常可以采用人工的方式,即由工作人员在观看视频资源后,用语言文字总结出视频资源的主要内容,并发布给需要观看的用户。
然而,这种人工的方式通常只针对热度较高的视频资源,不可能对每个视频资源进行总结,且每次总结都需要工作人员完整观看该视频资源,效率低且花费大量的人力成本。
发明内容
鉴于上述问题,提出了本发明实施例以便提供克服上述问题或者至少部分地解决上述问题的一种视频处理的方法和装置。
为了解决上述问题,本发明实施例公开了一种视频处理的方法,所述方法包括:
获取目标视频数据;
从所述目标视频数据中,确定一组或多组第一相似帧,并确定每组第一相似帧对应的第一整体特征向量;
将所述第一整体特征向量输入预先建立的数据模型,并接收所述数据模型针对所述目标视频数据输出的内容描述信息。
可选地,所述从所述目标视频数据中,确定一组或多组第一相似帧的步骤包括:
确定所述目标视频数据中每个图像帧对应的第一特征向量;其中,所述每个图像帧按在所述目标视频数据中的播放顺序进行排列;
根据所述第一特征向量,确定多个第一关键帧;
针对每个第一关键帧,将所述第一关键帧,以及所述第一关键帧与后一个第一关键帧之间的图像帧作为第一相似帧,得到一组或多组第一相似帧。
可选地,所述根据所述第一特征向量,确定多个第一关键帧的步骤包括:
针对相邻图像帧,计算所述第一特征向量的差异值;其中,所述相邻图像帧为相邻排列的两个图像帧;
当检测到所述差异值大于预设差异值时,将所述差异值大于预设差异值对应的相邻图像帧中后一个图像帧,作为第一关键帧。
可选地,所述确定每组第一相似帧对应的第一整体特征向量的步骤包括:
针对每组第一相似帧,对各个第一相似帧对应的第一特征向量进行均值处理,得到所述每组第一相似帧对应的第一整体特征向量。
可选地,在所述获取目标视频数据的步骤之前,还包括:
获取样本视频数据;
从所述样本视频数据中,确定一组或多组第二相似帧,并确定每组第二相似帧对应的第二整体特征向量和内容描述向量;
采用基于注意力机制的循环神经网络,对所述第二整体特征向量和所述内容描述向量进行训练,以建立数据模型。
可选地,所述确定每组第二相似帧对应的内容描述向量的步骤包括:
针对每组第二相似帧,获取对应的原始内容描述;
对所述原始内容描述进行分词处理,并对所述分词处理后的原始内容描述进行去重处理,得到一个或多个字词;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京奇艺世纪科技有限公司,未经北京奇艺世纪科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810538414.8/2.html,转载请声明来源钻瓜专利网。





