[发明专利]一种视频摘要生成方法及装置有效

专利信息
申请号: 201410570690.4 申请日: 2014-10-23
公开(公告)号: CN105530554B 公开(公告)日: 2020-08-07
发明(设计)人: 董振江;邓硕;田玉敏;唐铭谦;冯艳 申请(专利权)人: 南京中兴新软件有限责任公司
主分类号: H04N21/8549 分类号: H04N21/8549
代理公司: 上海晨皓知识产权代理事务所(普通合伙) 31260 代理人: 成丽杰
地址: 210012 江苏*** 国省代码: 江苏;32
权利要求书: 查看更多 说明书: 查看更多
摘要: 发明提供了一种视频摘要生成方法及装置,该方法包括:将原始视频划分为多个视域;根据对象轨迹与各个视域的接近程度,将原始视频包含的各个对象轨迹,划分到该对象轨迹最为接近的视域中;根据视域中对象轨迹的活跃程度,统计视域的活跃度指标,并根据所述活跃度指标是否超出预设门限,将各个视域划分为重要视域和次要视域;对各个重要视域和次要视域内的对象轨迹进行并行处理,并将并行处理后得到的各个视域进行合并,生成视频摘要。在本发明的视频摘要生成方法中,通过对重要视域和次要视域内的对象轨迹的并行处理,减少了轨迹组合的运算量,加快了运算速度,使用户更加简单明了的关注重要视域内的主要目标。
搜索关键词: 一种 视频 摘要 生成 方法 装置
【主权项】:
一种视频摘要生成方法,其特征在于,包括:将原始视频划分为多个视域;根据对象轨迹与各个视域的接近程度,将原始视频包含的各个对象轨迹,划分到该对象轨迹最为接近的视域中;根据视域中对象轨迹的活跃程度,统计视域的活跃度指标,并根据所述活跃度指标是否超出预设门限,将各个视域划分为重要视域和次要视域;对各个重要视域和次要视域内的对象轨迹进行并行处理,并将并行处理后得到的各个视域进行合并,生成视频摘要。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南京中兴新软件有限责任公司,未经南京中兴新软件有限责任公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/patent/201410570690.4/,转载请声明来源钻瓜专利网。

同类专利
  • 一种视频浓缩方法和相关装置-202310273060.X
  • 胡碧昕 - 腾讯科技(深圳)有限公司
  • 2023-03-16 - 2023-10-27 - H04N21/8549
  • 本申请公开了一种视频浓缩方法和相关装置,可应用于人工智能、计算机视觉等各种场景。在浓缩视频时,可以通过视频浓缩参数来实现对待浓缩对象进行筛选,即针对待处理视频中的运动对象可能涉及的多个对象类型,通过视频浓缩参数筛选出目标对象类型作为本次视频浓缩的目标。在视频浓缩参数的指导下,通过计算机视觉技术可从待处理视频的运动对象中识别出符合目标对象类型的目标运动对象,从而基于目标运动对象的运动轨迹,生成待处理视频对应目标运动对象的浓缩视频。由此可见,通过视频浓缩参数,可以有效的满足精细化的视频浓缩需求,使得浓缩视频中仅涉及与视频浓缩需求相符的目标运动对象,有效提升了浓缩视频的精度。
  • 视频生成方法-202310660367.5
  • 王九牛;张迎亚;陈大友 - 阿里巴巴(中国)有限公司
  • 2023-06-05 - 2023-10-24 - H04N21/8549
  • 本说明书实施例提供视频生成方法,包括:确定待处理文本,并生成初始噪声;将初始噪声和待处理文本输入视频生成模型,在视频生成模型中,利用时空处理单元在时序维度和空间维度对初始噪声和待处理文本进行处理,获得至少两个视频帧表征、以及至少两个视频帧表征的时序关系,其中,视频生成模型根据文本样本、文本样本对应的视频帧表征样本和加噪视频帧表征样本训练得到,加噪视频帧表征样本根据样本噪声对视频帧表征样本进行加噪获得;根据至少两个视频帧表征、以及至少两个视频帧表征的时序关系,确定待处理文本对应的目标视频。能够实现单个视频帧的生成、以及单个视频帧之间时序关系的生成,保证每个视频帧之间的帧间一致性。
  • 音乐匹配方法、装置、电子设备和计算机可读存储介质-202210348876.X
  • 胡建丰;黄鸣晨;张依依 - 腾讯科技(深圳)有限公司
  • 2022-04-01 - 2023-10-24 - H04N21/8549
  • 本申请实施例公开了一种音乐匹配方法、装置、电子设备和计算机可读存储介质;在本申请实施例中,显示待匹配音乐的音乐匹配界面,所述音乐匹配界面内包括匹配控件;响应于对所述匹配控件的触发操作,显示音视频界面,所述音视频界面包括所述待匹配音乐的目标音轨以及与所述目标音轨匹配的目标视频集合,所述目标音轨为对所述待匹配音乐进行音轨分离后得到的至少一条音轨。本申请实施例可以自动找到与待匹配音乐的目标音轨匹配的目标视频,并在音视频界面显示目标音轨和目标视频,无需用户手动逐个查看,较为便捷。
  • 基于热点信息识别的视频生成方法及相关设备-202310651097.1
  • 周胜杰 - 深圳康佳电子科技有限公司
  • 2023-06-02 - 2023-10-24 - H04N21/8549
  • 本发明公开了一种基于热点信息识别的视频生成方法及相关设备,所述方法包括:获取媒资库,其中,所述媒资库中包括多种媒资素材;对多个资讯平台的热点信息进行侦听并获取热点关键字;对所述媒资库中的所述媒资素材进行信息识别,获得各所述媒资素材对应的识别结果,根据所述识别结果与所述热点关键字的关联关系获取热点媒资素材库;根据所述热点媒资素材库和预设的视频创作模板生成目标热点视频。本发明有利于提高热点信息视频创作的效率。
  • 视频的摘要信息生成方法、装置、服务器以及存储介质-202210812837.0
  • 向君 - 北京达佳互联信息技术有限公司
  • 2022-07-11 - 2023-10-17 - H04N21/8549
  • 本公开关于一种视频的摘要信息生成方法、装置、服务器以及存储介质,属于视频技术领域。本公开通过获取视频的多个文本描述信息,从多个文本描述信息的关键词词组中,确定符合摘要条件的目标关键词组,进而基于目标关键词组所属的文本描述信息,生成视频的摘要信息,从而无须用户撰写摘要信息,降低了用户的时间成本,增加用户在视频发布平台上发布视频或观看视频的吸引力,从而提高了视频发布平台的用户黏度。
  • 一种基于图模型和注意力机制的视频摘要方法、装置、存储介质及设备-202310862903.X
  • 干宗良;裴逸;陈昌红;崔子冠;刘峰 - 南京邮电大学
  • 2023-07-14 - 2023-10-13 - H04N21/8549
  • 本发明公开了一种基于图模型和注意力机制的视频摘要方法、装置、存储介质及设备,属于计算机视觉和深度学习技术领域,方法包括:获取视频;将视频输入到训练好的视频摘要模型中得到摘要视频;视频摘要模型通过以下方法进行训练:获取训练视频并按帧进行分割得到视频帧;通过卷积神经网络提取视频帧的图像特征;分别用全局图注意力模型和局部多头注意力模型提取图像特征的全局注意力特征和局部注意力特征,然后将两者相加得到视频帧特征;将视频帧特征和预先获取的关键帧输入到视频摘要模型中进行训练,得到训练好的视频摘要模型;本发明能够提高准确性和镜头多样性。
  • 新闻视频的摘要生成方法及装置-202110808406.2
  • 张记袁;郑烨翰;蔡远俊;彭卫华 - 北京百度网讯科技有限公司
  • 2021-07-16 - 2023-10-13 - H04N21/8549
  • 本公开提供了一种新闻视频的摘要生成方法及装置,涉及计算机技术领域,尤其涉及知识图谱、深度学习、计算机视觉、语音技术领域。具体实现方案为:获取新闻文本库和待生成摘要的新闻视频;对所述新闻视频识别标题得到原始标题和/或对所述新闻视频提取摘要得到所述新闻视频的原始摘要;根据所述原始标题和/或原始摘要,在所述新闻文本库中检索得到至少一篇候选新闻文本;根据所述原始摘要和/或所述原始标题与所述至少一篇候选新闻文本的相似度,从所述至少一篇候选新闻文本中确定目标新闻;根据所述目标新闻,生成所述新闻视频的摘要。本公开有效提高了新闻视频摘要生成的准确度。
  • 一种基于遗憾最小化的视频摘要方法-202311000460.X
  • 郑吉平;徐宇尧 - 南京航空航天大学
  • 2023-08-09 - 2023-10-10 - H04N21/8549
  • 本发明涉及一种视频摘要方法,具体的说,设计的是一种利用遗憾最小化,截取部分视频画面,得到一个令绝大多数人满意的摘要的方法。本发明致力于解决视频摘要生成时所需要的成本问题,例如深度学习方法中的学习训练成本,或者对观众的问询成本等。本发明针对视频中的各画面的多种信息,利用一系列图像处理算法及框架实现了信息的量化,使画面转变为多维数据,针对大量的多维数据,本发明创新地使用遗憾最小化算法与视频摘要任务结合,筛选出令绝大多数人最满意的摘要结果,并对结果在情节覆盖性上进行补充。本发明广泛适用于各类视频浏览、视频检索、视频推广、监控查询等应用场景。
  • 摘要视频生成方法、装置、计算机设备及存储介质-202210689675.6
  • 刘钊 - 中国平安人寿保险股份有限公司
  • 2022-06-17 - 2023-09-15 - H04N21/8549
  • 本申请涉及大数据技术,公开了一种摘要视频生成方法、装置、设备及介质,方法包括:获取对话视频,提取对话视频对应的对话录音,根据对话录音与对话视频生成待处理视频,从待处理视频中提取得到多个图像帧,根据图像帧生成至少一个邻近相似帧集合,确定邻近相似帧集合所对应的特征帧,根据特征帧从至少一个邻近相似帧集合中确定目标帧集合,获取目标帧集合对应的目标声轨,根据目标声轨生成对话段落,根据对话段落与待处理视频生成关键对话视频,并拼贴关键对话视频得到目标摘要视频,以将对话视频中的冗杂信息进行筛除,并生成精炼程度与逻辑关联程度较佳的摘要视频,以进一步提升后续视频分析的效果并降低分析难度。
  • 一种训练适用于视频监控设备的视频摘要方法-202310705274.X
  • 李辉;金克;李浩然;陈荣;郭世凯 - 大连海事大学
  • 2023-06-14 - 2023-09-05 - H04N21/8549
  • 本发明公开了一种训练适用于视频监控设备的视频摘要方法:包括如下步骤:使用监控设备收集原始视频;采用帧采样策略对原始视频进行下采样处理,获取每个视频帧的特征向量,将特征向量输入至时序卷积网络建立帧之间的长期依赖关系;将获取的一系列视频帧的特征向量输入到深度摘要网络中,采用双向时序卷积和自注意力机制将视频两个方向的上下文信息进行整合,从而捕获视频帧之间的长期依赖关系;将原始视频输入特征提取模块获取视频帧的特征,通过深度摘要网络获取视频帧特征之间的长期依赖关系,分别计算视频帧级重要性分数,通过背包算法选取分数高的部分组合成视频摘要。
  • 直播封面生成方法和设备-202310738169.6
  • 杜平杰;殷雅俊 - 北京花房科技有限公司
  • 2023-06-20 - 2023-09-05 - H04N21/8549
  • 本发明实施例提供一种直播封面生成方法和设备,所述方法包括:采集当前周期内的目标直播间的直播视频,从直播视频中,提取多张目标图像。确定直播视频对应的特征信息。根据多张目标图像和特征信息,生成目标封面图像,并将目标直播间当前的封面图像替换为目标封面图像。上述方案中,根据多张目标图像以及直播视频对应的特征信息,生成目标封面图像,可以提高生成的直播封面质量,使得生成的直播封面可以更好地反映直播内容。并且,通过定期采集直播视频,可以及时将目标直播间的直播封面切换为与当前直播内容相匹配的目标直播封面,以实现动态调整直播封面,便于观众根据直播封面选择相应的直播间,提高了直播间的点击率和点击转化率。
  • 视频播放方法以及相关装置、设备-202210731907.X
  • 杨博研 - 平安银行股份有限公司
  • 2022-06-25 - 2023-08-25 - H04N21/8549
  • 本申请公开视频播放方法以及相关装置、设备。视频播放方法包括:获取到包括视频目录的目标视频,其中,视频目录包括多个与目标视频的各视频分段对应的目录摘要;响应于接收到视频目录中目标目录摘要的触发指令,播放目标目录摘要对应的视频分段。上述方案,能够提高用户对目标视频内容信息的获取效率以及用户观看目标视频的便捷度。
  • 视频封面的选取方法、装置、设备及存储介质-202210266565.9
  • 刘文然 - 腾讯科技(上海)有限公司
  • 2022-03-17 - 2023-08-22 - H04N21/8549
  • 本申请公开了一种视频封面的选取方法、装置、设备及存储介质。本申请提供的方案能够基于目标视频的多个初始视频帧的聚类结果,将目标视频划分为多个视频片段,并从该多个视频片段中选取多个候选视频帧,进而能够基于该多个候选视频帧的封面评测值选取视频封面。由于该方法只需对从视频片段中确定出的候选视频帧进行封面评测值的计算,因此可以避免对类似的初始视频帧进行重复计算,提高视频帧的评测效率,进而提高视频封面的选取效率。又由于多个候选视频帧来自不同的视频片段,即该多个候选视频帧属于不同的场景,因此从该多个候选视频帧中选取视频封面,可以有效确保视频封面选取的多样性。
  • 一种视频封面更新方法、装置及计算机可读存储介质-202310579391.6
  • 郎耀亮 - 湖南快乐阳光互动娱乐传媒有限公司
  • 2023-05-22 - 2023-08-18 - H04N21/8549
  • 本申请实施例提供了一种视频封面更新方法、视频封面更新装置及计算机可读存储介质,该方法包括:获取目标视频的视频热度数据;基于视频热度数据,生成目标视频的视频热度评分;若视频热度评分高于预设阈值,获取目标视频对应的用户行为数据;基于用户行为数据,对目标视频的视频封面进行更新。本申请实施例根据视频热度数据触发更新视频封面,克服了视频封面单一性的问题,通过对用户行为数据的分析,根据不同的用户行为数据生成不同的视频封面,容易引起用户兴趣,增加了用户粘性,提升了视频热度。
  • 一种基于神经网络模型的短视频片段自动生成方法及系统-202111598610.2
  • 王晶 - 空间视创(重庆)科技股份有限公司
  • 2021-12-24 - 2023-08-18 - H04N21/8549
  • 本发明涉及视频处理技术领域,具体公开了一种基于神经网络模型的短视频片段自动生成方法及系统,其中方法包括如下步骤:过滤冗余或残缺的镜头并按时间对过滤后的镜头排序;将排序后的镜头输入预训练的第二神经网络模型,从第二神经网络模型获得场景边界的输出结果,根据场景边界划分场景;使用二分法递归地拆分时长大于第一阈值的场景,并判断时长小于第二阈值的场景是否相邻且相似,若相邻且相似,进行合并;统计场景中每个镜头在特征空间中的密度,根据密度计算场景分值;根据场景分值对场景进行倒序排列并返回对应的场景起止时间;根据场景的起止时间以及设置的时长截出视频片段。采用本发明的技术方案能够保留视频中的精彩场景。
  • 一种显示设备、本地视频文件预览及缩略图显示方法-202210102166.9
  • 李源;陶中南;邹金宏 - VIDAA国际控股(荷兰)公司
  • 2022-01-27 - 2023-08-08 - H04N21/8549
  • 本申请公开了一种显示设备、本地视频文件预览及缩略图显示方法,显示设备包括显示器和控制器,控制器被配置为:响应于第一输入指令,使得选择器由第一浏览器标签移动至第二浏览器标签;如果第二浏览器标签对应的媒体文件是视频文件,控制第二浏览器标签显示透明;下发视频文件的第一路径、第二浏览器标签的尺寸和位置;解码第一路径下的视频文件;在视频层创建播放窗口,播放窗口的尺寸与第二浏览器标签的尺寸相同,播放窗口的位置与第二浏览器标签的位置对应;在预设时间下发起播状态,在播放窗口中播放视频文件。本申请实施例通过定制化浏览器标签和硬件解码的方式,实现了本地视频文件缩略图显示和小视窗播放预览,提升用户体验。
  • 一种视频处理方法、装置、设备及存储介质-202210104029.9
  • 田思达;赵天昊 - 腾讯科技(深圳)有限公司
  • 2022-01-27 - 2023-08-08 - H04N21/8549
  • 本申请实施例公开了一种视频处理方法、装置、设备及存储介质。其中方法包括:对待处理的视频进行抽帧处理,得到候选图像集合,至少基于美学维度和目标对象属性,对候选图像集合中的N个视频帧图像分别进行质量检测,得到每个视频帧图像的质量检测结果;按照质量检测结果从候选图像集中选取M个视频帧图像,并将这M个视频帧图像确定为视频的封面图像。可见,通过对视频中的视频帧图像进行质量检测,得到各个视频帧图像质量检测结果,基于各个视频帧图像质量检测结果能够更加高效、准确地确定视频的封面图像。
  • 基于深度学习的自动化视频摘要生成方法-202210337196.8
  • 兰雨晴;唐霆岳;余丹;邢智涣;王丹星;黄永琢 - 慧之安信息技术股份有限公司
  • 2022-03-31 - 2023-08-01 - H04N21/8549
  • 本发明提供了基于深度学习的自动化视频摘要生成方法,其对同一环境场合的不同方位区域进行同步拍摄,得到若干环境场合子视频;对环境场合子视频进行识别处理,得到关于环境场合子视频出现的不同对象的语义标签,继而在环境场合子视频的预设画面中形成视频内容摘要;最后按照每个环境场合子视频的拍摄方位,将所有环境场合子视频进行画面拼接,从而得到相应的环境全景场合视频,这样可对不同摄像头拍摄的环境场合子视频进行同步识别分析,对环境场合子视频中的对象进行标定,并生成相匹配的视频内容摘要,从而对视频进行全面和准确的筛选识别,提高对视频识别处理的自动化和智能化程度。
  • 视频生成方法、装置、介质和计算设备-202310397160.3
  • 赵剑;马瑞茄;蒋超;李宜烜;黄安麒;虞勇波;赵翔宇;刘华平 - 杭州网易云音乐科技有限公司
  • 2023-04-10 - 2023-07-25 - H04N21/8549
  • 本公开的实施方式提供了一种视频生成方法、装置、介质和计算设备,该方法包括:基于待处理音频的音频文本获得多个词句;生成每个所述词句对应的噪声图;根据所述词句对所述词句对应的噪声图进行降噪,得到所述词句对应的第一图像;根据各张所述第一图像,生成所述待处理音频对应的视频。本公开中,通过生成音频中的词句对应的噪声图,再通过对噪声图进行降噪得到词句所匹配的图像,使得视频中的图像能够代表音频中词句所传达的内容,提高了视频与音频所传达内容的匹配度。
  • 一种播放视频的方法及电子设备-202110080633.8
  • 苏达;张韵叠;于远灏 - 华为技术有限公司
  • 2021-01-20 - 2023-07-11 - H04N21/8549
  • 本申请提供了一种播放视频的方法及电子设备,该电子设备可以包括手机、平板、电脑等包含显示屏的设备,该方法应用于视频播放过程,通过检测目标视频的片头的特定时长内使用的不同的运镜类型,并根据目标视频的运镜类型匹配相关联的开场动画,即在该目标视频的播放过程中,以相关联的展开方式展开该目标视频的播放窗口,呈现给用户不同的视觉效果。具体地,该目标视频的播放窗口可以具有动态变化效果,同时可以伴随着背景图片的尺寸大小、透明度等动态变化过程,可以进一步为用户提供一种连贯的沉浸式体验,提高了用户的视觉体验。
  • 一种基于运动信息协助的视频摘要生成方法-202310504159.6
  • 张云佐;刘亚猛;郑宇鑫;康伟丽;张天;武存宇;朱鹏飞;杨月辉;王双双 - 石家庄铁道大学
  • 2023-05-06 - 2023-07-11 - H04N21/8549
  • 本发明公开了一种基于运动信息协助的视频摘要生成方法,用于自动地从视频中挑选最重要的片段,从而提升视频浏览效率。所提方法首先根据输入视频获取外观帧序列和运动帧序列,并采用神经网络模型分别提取外观特征和运动特征,然后根据镜头分割算法检测视觉变化点,得到子镜头集合,接着利用构建的视频摘要生成模型预测镜头级重要性得分,最后根据预测得分生成动态视频摘要。所提方法在使用静态的外观信息的基础上进一步引入了运动信息,通过实现有效的单模态特征编码以及跨模态特征交互提升了对视频内容的理解能力。在SumMe和TVSum两个基准数据集上的实验结果充分证明了所提方法的有效性和先进性。
  • 视频信息的提取方法、装置、终端设备及计算机介质-202310680662.7
  • 冯建设;朱枫;谢旻 - 深圳市信润富联数字科技有限公司;香港城市大学
  • 2023-06-09 - 2023-07-07 - H04N21/8549
  • 本发明公开了一种视频信息的提取方法、装置、终端设备及计算机介质,涉及图像处理技术领域,包括:对所述目标视频图像进行分帧处理得到所述目标视频图像内的各单帧图像;对各所述单帧图像进行计算得到各所述单帧图像之间的各图像相似度,根据各所述图像相似度在各所述单帧图像中提取各所述关键帧图像;将各所述关键帧图像进行排序得到排序结果,根据所述排序结果将各所述关键帧图像组成关键帧图像集。本发明达到了令编写人员能够更高效浏览学习目标视频图像中的内容,提高编写人员撰写标准作业程序效率并减少编写人员在编撰过程中的工作量的技术效果。
  • 标题生成方法、计算机设备、存储介质和计算机程序产品-202310150852.8
  • 洪思欣 - 腾讯音乐娱乐科技(深圳)有限公司
  • 2023-02-07 - 2023-06-02 - H04N21/8549
  • 本申请涉及一种标题生成方法、计算机设备、存储介质和计算机程序产品。所述方法包括:将目标音视频输入至训练完成的语义特征提取模型,得到所述目标音视频的音视频语义特征;所述训练完成的语义特征提取模型通过视频样本和音频样本训练得到;对所述音视频语义特征进行编码处理,得到所述音视频语义特征的语义编码;将所述语义编码输入至训练完成的标题文本生成模型,得到所述目标音视频的标题文本;所述训练完成的标题文本生成模型通过样本语义编码训练得到。采用本方法能够提高视频标题生成效率。
  • 基于人员信息快速检索的视频生成系统及方法-202211717719.8
  • 王晶;刘才果;张俊林;罗建华 - 空间视创(重庆)科技股份有限公司
  • 2022-12-29 - 2023-05-30 - H04N21/8549
  • 本发明涉及视频合成技术领域,具体公开了基于人员信息快速检索的视频生成系统,包括:存储模块,所述存储模块用于存储马拉松比赛的注册人员人脸图像和马拉松视频信息;采集模块,所述采集模块用于采集马拉松比赛的参赛人员人脸图像,人脸识别模块用于将采集的参赛人员人脸图像与存储的注册人员的人脸图像进行匹配,所述视频合成模块用于将所收到的镜头瞬间进行合成形成短视频。基于人员信息快速检索的视频生成方法,包括:存储注册人员的人脸图像和马拉松视频信息,采集参赛人员的人脸图像。采用本发明的技术方案,可以用于解决所生成的人员视频中存在不良视频片段的问题,提高视频剪辑、查找工作效率,减少视频后期处理工作量。
  • 视频封面展示方法、装置、电子设备和存储介质-202310034481.7
  • 汪山人 - 北京奇艺世纪科技有限公司
  • 2023-01-10 - 2023-05-16 - H04N21/8549
  • 本发明实施例提供视频封面展示方法、装置、电子设备和存储介质,该方法包括:获取用户偏好和多个视频对应的多个封面图,封面图携带有文本描述,根据文本描述和用户偏好进行打分,得到封面图的偏好分数,基于偏好分数,将封面图进行排序以得到第一封面图集合,当检测到用户在目标视频上停留的时长超过预设停留时长时,将目标视频的目标第一封面图集合中的多个目标封面图进行顺序展示。本发明实施例通过将每个视频关联多个封面图,使得每个视频均可动态展示多个封面图,可有效提升用户浏览视频时的内容丰富度,有助于抓住用户注意力,快速让用户抓到整体视频的要点,且所展示的封面图是与用户偏好相匹配的,可极大提升封面图的分发效率和用户体验。
  • 基于GRU网络的视频摘要生成方法与系统-202011349745.0
  • 陈周元 - 广东工业大学
  • 2020-11-26 - 2023-04-07 - H04N21/8549
  • 本发明提供的一种基于GRU网络的视频摘要生成方法,包括:对输入的原始视频下采样并进行特征提取,生成视频帧序列;基于GRU网络的Seq2Seq模型对视频帧序列进行分析并捕捉视频序列的上下文信息,生成每一帧的重要性得分;根据重要性得分结果,使用非极大值抑制算法提取关键帧并去除冗余帧,获取静态视频摘要和动态视频摘要。本发明还提供的一种基于GRU网络的视频摘要生成系统,通过在Seq2Seq模型中引入GRU网络单元,使模型在处理视频帧序列时能最大程度保留帧与帧之间的长距离影响因素,同时减少模型的参数,有效减少了模型的计算量;使用非极大值抑制算法可以有效处理冗余帧,从而获取更具代表性的视频摘要。
  • 一种封面确定方法、装置、电子设备及存储介质-202211457157.8
  • 宁本德 - 北京奇艺世纪科技有限公司
  • 2022-11-21 - 2023-04-04 - H04N21/8549
  • 本发明实施例提供了一种封面确定方法、装置、电子设备及存储介质,通过按照第一抽取间隔从目标视频中抽取多个第一待选视频帧后,从中确定出第一封面视频帧。再按照第二抽取间隔,从包含有第一封面视频帧的视频片段中再抽取多个第二待选视频帧,其中因为第二抽取间隔小于第一抽取间隔,可以使得抽取的视频帧更加密集。从多个第二待选视频帧中确定第二封面视频帧作为目标视频的封面,可以避免错过因抽帧间隔过大而导致遗漏更合适的视频帧,提高封面选图效率。同时本申请只需从多个第二待选视频帧中去确定第二封面视频帧,可以避免因为抽取的视频帧过多而对后续的存储与算法处理造成过大压力。
专利分类
×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

400-8765-105周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top