[发明专利]影视剧内容检索方法和装置有效

专利信息
申请号: 202010280565.5 申请日: 2020-04-10
公开(公告)号: CN111680189B 公开(公告)日: 2023-07-25
发明(设计)人: 王建华;卢佳俊;刘广涛;刘东学;王灿 申请(专利权)人: 北京百度网讯科技有限公司
主分类号: G06F16/738 分类号: G06F16/738;G06F16/783
代理公司: 北京清亦华知识产权代理事务所(普通合伙) 11201 代理人: 王艳斌
地址: 100085 北京市*** 国省代码: 北京;11
权利要求书: 查看更多 说明书: 查看更多
摘要: 本申请公开了一种影视剧内容检索方法和装置,涉及知识图谱领域。具体实现方案为:根据各影视剧的实体基础信息生成对应的基础摘要信息;根据各影视剧各子集的子集影视数据,生成与各子集对应的子集摘要信息;根据各影视剧对应的基础摘要信息,以及与各子集对应的子集摘要信息建立影视剧图谱数据库;根据影视剧图谱数据库向用户反馈与影视搜索信息对应的目标影视剧的目标子集播放入口。由此,可以根据影视剧图谱为用户检索到与用户需求匹配的整集影视剧,提升了用户的检索体验。
搜索关键词: 影视剧 内容 检索 方法 装置
【主权项】:
暂无信息
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京百度网讯科技有限公司,未经北京百度网讯科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/patent/202010280565.5/,转载请声明来源钻瓜专利网。

同类专利
  • 一种基于大数据的可视化剧本生成系统-202210403472.6
  • 田力男 - 田力男
  • 2022-04-18 - 2023-10-27 - G06F16/738
  • 本发明提出一种基于大数据的可视化剧本生成系统,包括:素材处理单元,其制定多个分类体系,对每个素材在不同分类体系下均进行标注;素材匹配单元,其将用户输入映射到所述分类体系中的类别上,筛选出匹配的素材;和素材重组单元,其基于素材之间的逻辑关系对所述素材进行组合,得到最优的素材排列作为剧本。本发明的系统可以给创意型人才提供可形成可视化剧本的工具,降低非专业人士创作的难度,提升专业创作人士的工作效率,提升作品的整体质量。
  • 一种基于双自注意力胶囊网络的视频摘要方法-201911313856.3
  • 王洪星;傅豪;徐玲;杨梦宁;洪明坚;葛永新;黄晟;陈飞宇 - 重庆大学
  • 2019-12-19 - 2023-10-27 - G06F16/738
  • 本发明公开了一种基于双自注意力胶囊网络的视频摘要方法,包括以下步骤:S1:将视频摘要问题视为一个视频帧序列的标记问题;S2:对于给定的视频,提取每个视频帧的初始特征向量;S3:利用双注意力模型对初始特征向量进行特征细化;S4:利用双流胶囊网络来对细化特征进行融合,并对视频的每个帧进行标记;S5:使用相应目标函数,以深度学习的方式来训练上述的模型;S6:根据S5训练好的模型,来生成最终的摘要。有益效果:能够有效地捕捉短期和长期依赖关系而不受视频时长的限制,且该方法能够并行处理,降低运行时长,最终得到的摘要视频是无冗余的、完整的。
  • 一种采访视频集锦生成方法和系统-202010321662.4
  • 王灿进;王敏;杨新钰;徐常亮 - 新华智云科技有限公司
  • 2020-04-22 - 2023-10-27 - G06F16/738
  • 本发明公开了一种采访视频集锦生成方法和系统,所述方法包括如下步骤:预建立至少一个对象知识图谱;根据场景位置构建至少一环境知识库;根据所述对象知识图谱和/或环境知识库内容进行采访问答;获取采访问答的音视频信息,并对采访问答的音视频信息进行处理。本发明提供的采访视频集锦生成方法和系统可提高采访视频集锦的生产效率,构建环境知识库和利用关键词匹配环境知识库的方法可提高采访话题的关联性、互动性;图文解释等可视化显示提高采访的体验效果。
  • 视频的生成方法、装置、计算机设备及存储介质-202010363105.9
  • 吕孟叶;杨跃;黄安麒;董治;李深远;陈兴頔;杨小康 - 腾讯音乐娱乐科技(深圳)有限公司
  • 2020-04-30 - 2023-10-20 - G06F16/738
  • 本申请公开了一种视频的生成方法、装置、计算机设备及存储介质,属于计算机技术领域。所述方法包括:获取待播放音频的关联信息,根据关联信息,从素材库中获取与待播放音频的关联度大于指定阈值的多个备选素材。确定每个备选素材与多个备选素材组成的素材集合之间的语义相似度,得到多个备选素材的语义相似度。按照多个备选素材的语义相似度的高低排序,从多个备选素材中依序选取N个备选素材作为目标素材,目标素材的时长总和大于或等于待播放音频的音频时长,N为大于1的整数。基于目标素材生成用于与待播放音频配合播放的目标视频。如此得到的视频与待播放音频的相关度高,且视频中的素材画风比较和谐,能够给用户带来很好的视觉体验。
  • 一种基于关键词的视频摘要生成方法-201910615122.4
  • 黄煜博;王若梅;林淑金;周凡;林格 - 中山大学
  • 2019-07-09 - 2023-10-20 - G06F16/738
  • 本发明公开了一种基于关键词的视频摘要生成方法,通过对视频进行视觉通道处理,进行基于关键词的视觉内容摘要提取,得到图像摘要;视频语音文本内容预处理,进行基于关键词的语音文本内容摘要提取,得到文本摘要;利用图像摘要和文本摘要,获得最终图文摘要。本发明提供了一种自动生成视频摘要的方法,大大减少了视频上传者手工操作的时间;充分考虑了视频搜索用户的需求,为用户提供了更加贴合自己搜索意图的视频摘要;使用基于人工智能深度学习技术的方法,使生成的视频摘要更能准确的反映视频的内容。
  • 云环境下基于自注意力机制的自动视频摘要方法及系统-202310752735.9
  • 王祖俪;黄永鑫;王娟;石磊 - 成都信息工程大学
  • 2023-06-25 - 2023-10-13 - G06F16/738
  • 本发明属于计算机视觉方向领域,公开了一种基于自注意力机制的自动视频摘要方法及系统,依靠用户的原始视频作为输入,通过新的帧特征选择方法,形成集中注意力特征矩阵;再基于回归网络的视频帧重要性评分模型,采用自定义的损失函数进行校正,得到视频帧评分;该方法部署于云服务器端,在服务器端得到帧评分结果后,将结果发送至客户端,最终自动合成视频摘要。本发明克服了现有视频摘要方法对注意力信息利用不充分,帧特征信息存在重复计算导致时效性不高等问题,同时系统基于云环境进行部署,减少对客户端硬件性能的要求,实现端到端部署和训练,最终有效提升视频摘要自动生成的性能。
  • 响应于视频搜索查询提供相关视频场景-202310853571.9
  • S·索尼;A·达加尔;A·德哈万 - 奥多比公司
  • 2017-06-06 - 2023-10-13 - G06F16/738
  • 本申请的各实施例涉及响应于视频搜索查询提供相关视频场景。本公开涉及用于响应于视频搜索查询而提供相关视频场景的方法和系统。系统和方法标识媒体对象的多个关键帧并检测多个关键帧中所表示的一个或多个内容特征。基于一个或多个所检测出的内容特征,系统和方法将指示所检测出的内容特征的标记与媒体对象的多个关键帧相关联。响应于接收到包括搜索项的搜索查询,系统和方法比较搜索项与所选择的关键帧的标记,标识描绘了与搜索项有关的至少一个内容特征的所选择的关键帧,并提供描绘了该至少一个内容特征的媒体项的预览图像。
  • 视频缩略图的显示方法、设备和存储介质-202111022205.6
  • 暴文莹;马捷;胡雅君 - 荣耀终端有限公司
  • 2021-09-01 - 2023-10-13 - G06F16/738
  • 本申请提供一种视频缩略图的显示方法、设备和存储介质,应用于电子设备,显示方法包括:在电子设备处于竖屏时,通过相机拍摄得到具有第一宽高比的第一视频;在相册中显示第一视频对应的第一缩略图,第一缩略图的宽高比和第一宽高比一致;在电子设备处于横屏时,通过相机拍摄得到具有第二宽高比的第二视频;在相册中显示第二视频对应的第二缩略图,第一缩略图和第二缩略图显示在同一行,第二缩略图的宽高比和第二宽高比不一致。本方案通过显示宽高比和视频的宽高比一致的缩略图,确保缩略图能较完整的呈现视频中的内容,从而改善用户在相册中浏览视频时的使用体验。
  • 基于无人机视频形成视场投影地图的方法及系统-202310556571.2
  • 任鑫怡;刘夯;穆亚梅 - 成都纵横大鹏无人机科技有限公司
  • 2023-05-17 - 2023-09-29 - G06F16/738
  • 本发明涉及基于无人机视频形成视场投影地图的方法及系统,所述方法包括如下步骤:获取视频数据并将视频数据进行实时传输;对视频数据进行处理以生成具有地理空间信息和影像特征的视频脚印图并更新为WDMS服务数据源;将WDMS服务数据源的视频脚印图进行可视化展示。本发明的方法通过将无人机的全动态视频数据进行动态的地理时空化的表达,基于视频数据,实现高精度、实时同步、直观定位无人机当前视场状态,同能够与当前地图叠加以进行地理定位及实现变化对比分析、态势环境观察分析等数据分析;无人机视频数据能够转为一种OpenGIS支持的地图影像数据格式,实现可视化和二次开发以提升视频数据的利用率。
  • 基于用户装置的消费模式来修改视频内容在用户装置上的呈现的方法、系统和介质-201680090549.1
  • 乔舒亚·布尔卡特;克里斯蒂安·魏滕伯纳 - 谷歌有限责任公司
  • 2016-11-11 - 2023-09-26 - G06F16/738
  • 本公开提供了一种用于基于所述用户装置的消费模式来修改呈现用户装置上的视频内容的方法、系统和介质。在一些实施例中,计算机实现方法包括:从用户装置接收用于呈现视频内容项的请求,其中所述视频内容项包括音频部分;将所述音频部分的片段识别为包括特定类型的音频内容(例如,无声内容、音乐内容、语音内容、影剧内容、非音乐内容等);确定与所述用户装置相关联的消费模式;通过移除所述视频内容项的与被识别为包括所述特定类型的音频内容的所述音频部分的片段相对应的部分,基于与所述用户装置相关联的所述消费模式来生成修改的视频内容项;以及使所述修改的视频内容项被呈现在所述用户装置上。
  • 视频预览方法、装置、电子设备、存储介质和程序产品-202110295401.4
  • 陈祎;陈薇;邵倩 - 北京达佳互联信息技术有限公司
  • 2021-03-19 - 2023-09-26 - G06F16/738
  • 本公开关于一种视频预览方法、装置、电子设备、存储介质和程序产品。所述方法包括:响应于对目标视频的视频详情预览指令,显示所述目标视频的视频详情预览页面;在所述视频详情预览页面展示页面详情模拟元素;所述页面详情模拟元素根据视频详情页面的交互元素生成;所述视频详情页面为所述目标视频发布后供用户观看所述目标视频的视频播放页面;所述交互元素用于供用户针对所述视频详情页面播放的所述目标视频进行交互操作,和/或显示所述目标视频的交互信息。上述方法可以避免由于视频详情页面中的交互元素的遮挡导致视频消费用户无法观看到视频的重要信息的问题。
  • 两阶段的anchor-based动态视频摘要方法-202110779734.4
  • 刘峰;徐达;赵峥涞 - 南京邮电大学
  • 2021-07-09 - 2023-09-26 - G06F16/738
  • 本发明是一种两阶段的anchor‑based动态视频摘要方法。该方法包括(1)构建anchor‑based神经网络,神经网络包括提取网络、自注意力机制网络、两阶段网络即区域推荐网络和回归分类网络;(2)确定区域推荐网络和回归分类网络中anchor的种类和长度,完成正负样本的分类,对步骤(1)构建的anchor‑based神经网络进行训练,固定训练好的参数,得到两阶段的anchor‑based神经网络模型,用得到的神经网络模型进行动态视频摘要。本发明提出的全新网络结构可以并行处理所有的视频帧,从而减少了训练的时间,有效提升了最终输出的精确度,并且本网络结构相对简单,对于计算能力的要求不高。
  • 视频封面文案的推荐方法、装置、电子设备及存储介质-202110402757.3
  • 汪谷;陈祎;任家锐 - 北京达佳互联信息技术有限公司
  • 2021-04-14 - 2023-09-19 - G06F16/738
  • 本公开关于一种视频封面文案的推荐方法、装置、电子设备及存储介质,其中方法通过响应于对目标视频的封面文案编辑指令,显示对目标视频的封面文案编辑界面,封面文案编辑界面中包括至少一项标题推荐信息,并通过封面文案编辑界面获取目标视频的目标封面标题,进而基于目标封面标题生成目标视频的目标封面文案。由于本公开在封面文案编辑界面中展示了至少一项标题推荐信息,从而能够更好地帮助用户获取目标封面标题,以生成目标封面文案,不仅提高了用户编辑封面文案的效率,而且提高了封面文案的质量。
  • 一种基于多智能体强化学习的视频摘要生成方法-202210211270.1
  • 周睿;方家璇;王金强;周庆国;雍宾宾 - 兰州大学
  • 2022-03-05 - 2023-09-19 - G06F16/738
  • 本发明公开一种基于多智能体强化学习的视频摘要生成方法。视频摘要生成是通过对原有视频的简化和压缩并保留其中的关键信息,在视频监控领域应用前景广阔,可以极大地减轻存储压力并提高工作效率。传统的视频摘要生成方法通过对整体视频进行时间分割,得到每一帧的关键性分数之后,根据分值大小以及所需要的关键帧的数量合成摘要。本发明提出的基于多智能强化学习的视频摘要生成方法利用多个智能体之间的协同合作特点,对视频的关键帧进行优先级投票选择,模拟人类制作视频摘要数据集关键帧标注的过程,采用多智能体深度确定性策略梯度的方法进行参数的更新,利用Actor‑Critic框架和策略集成的方法进行模型训练,最终生成的摘要视频具有代表性和多样性。
  • 服务器、显示设备及其视频搜索排序方法-202010641485.8
  • 蔡効谦 - 聚好看科技股份有限公司
  • 2020-07-06 - 2023-09-19 - G06F16/738
  • 本申请实施例公开了一种服务器、显示设备及其视频搜索排序方法,包括:建立音频文本与年龄的关联模型;接收显示设备发出的视频搜索请求;基于所述搜索关键词句,获得与所述搜索关键词句匹配的视频列表;获得所述搜索关键词句的文本年龄;基于所述音频文本与年龄关联模型、及所述视频列表中各个视频的名称,获得视频列表中各个视频的文本年龄;基于所述搜索关键词句的文本年龄、及所述视频列表中各个视频的文本年龄,对所述视频列表中的各个视频进行匹配排序;将排序后的视频列表下发给所述显示设备。该申请用以解决用户年龄识别及视频年龄识别,从而基于用户年龄和视频的年龄,对视频进行排序推荐,提升用户体验。
  • 视频封面确定方法、装置、设备及存储介质-202210210379.3
  • 刘文然;朱允全;谯睿智 - 腾讯科技(深圳)有限公司
  • 2022-03-04 - 2023-09-08 - G06F16/738
  • 本申请提供一种视频封面确定方法、装置、电子设备及存储介质,应用于云技术、人工智能、智慧交通、辅助驾驶等各种场景,该方法包括:从待处理视频的图像序列中获取候选图像;基于候选图像中的鼻部关键点和候选图像的第一尺寸信息,确定候选图像对应的人脸位置分析结果;根据候选图像中的眼部关键点和嘴部关键点,确定候选图像对应的人脸角度分析结果;基于人脸位置分析结果和人脸角度分析结果,确定候选图像对应的人脸综合分析结果;根据人脸综合分析结果,从候选图像中确定出目标图像。本申请实施例使得用于生成封面的目标图像更能够代表待处理视频的视频内容,提高了用于生成封面的目标图像的确定准确率。
  • 一种视频标题生成方法及装置-202110760887.4
  • 王亮 - 北京奇艺世纪科技有限公司
  • 2021-07-06 - 2023-09-05 - G06F16/738
  • 本发明实施例提供了一种视频标题生成方法及装置,涉及视频处理技术领域,方法包括:确定目标视频中的子视频;从目标视频的剧情描述文本中,确定与子视频相关联的剧情描述句,作为目标剧情描述句;其中,剧情描述文本用于描述目标视频的视频内容;基于目标剧情描述句,生成子视频的视频标题。基于上述处理,能够提高视频标题的生成效率。
  • 一种基于分层Transformer的视频摘要方法-202310759767.1
  • 张宝川;毛辉杰;葛棋棋;陈赟;张子川;肖昌震;陈胜利 - 浙江千从科技有限公司
  • 2023-06-26 - 2023-08-29 - G06F16/738
  • 本发明涉及一种基于分层Transformer的视频摘要方法,基于获得的视频,将长视频建模为“帧‑镜头”的双层结构,构建分别对应帧和镜头的分层Transformer网络,使用两层Transformer分别对帧和镜头编码,通过分层表征生成基于关键镜头的视频摘要。本发明考虑视频固有的语义结构,将视频分割为多个镜头,分别捕获镜头内和镜头间的时序依赖,通过分层表征生成视频摘要;考虑RNN的局限性,对视频的双层结构使用Transformer对帧和镜头先后建模,通过多头注意机制捕获序列中的全局依赖性,并行编码所有时间步,具有更有效的表征能力和更快的计算速度;适用于提取关键镜头和关键帧作为视频摘要的应用场景。
  • 一种视频浓缩方法、系统及设备-202110553205.2
  • 杨焰;魏东;金晓峰;徐天适;黄社阳 - 广州广电运通金融电子股份有限公司
  • 2021-05-20 - 2023-08-22 - G06F16/738
  • 本发明的一种视频浓缩方法、系统及设备,获取当前帧的图像并基于所述当前帧的图像,获取背景图像;基于所述背景图像的每个第一像素点进行计算,获取第一LBP特征向量;基于所述当前帧的图像的每个第二像素点进行计算,获取第二LBP特征向量;对所述第一LBP特征向量和所述第二LBP特征向量进行比较,获取静止像素点掩模;基于所述背景图像和所述当前帧的图像,获取第一前景图像掩模;基于所述静止像素点掩模重置第一前景图像掩模,获取第二前景图像掩模;对第二前景图像掩模做连通域分析,获得当前帧的检测目标队列;对当前帧的检测目标队列进行运动目标跟踪,输出当前帧检测目标的位置和id;基于当前帧检测目标的位置和id,生成浓缩后的视频文件。
  • 视频摘要生成方法及装置-202210101865.1
  • 袁微 - 腾讯科技(深圳)有限公司
  • 2022-01-27 - 2023-08-08 - G06F16/738
  • 本申请属于人工智能技术领域,具体涉及一种视频摘要生成方法及装置。本发明实施例可应用于车载场景。该视频摘要生成方法包括:从待处理视频中获取多个待处理帧;根据待处理帧的文本内容对各个待处理帧进行合并,得到多个片段区间;根据各个片段区间中的待处理帧的文本内容确定片段区间的第一情感强度;根据各个片段区间中的待处理帧中的表情确定片段区间的第二情感强度;对第一情感强度和第二情感强度进行加权求和运算,得到片段区间的情感分数;根据情感分数大于或等于预设值的片段区间对应的视频时间段,截取待处理视频得到视频片段,并将视频片段拼接成视频摘要。基于该方法能够高效准确地自动化生成视频摘要。
  • 响应于视频搜索查询提供相关视频场景-201710417832.7
  • S·索尼;A·达加尔;A·德哈万 - 奥多比公司
  • 2017-06-06 - 2023-08-04 - G06F16/738
  • 本公开涉及用于响应于视频搜索查询而提供相关视频场景的方法和系统。系统和方法标识媒体对象的多个关键帧并检测多个关键帧中所表示的一个或多个内容特征。基于一个或多个所检测出的内容特征,系统和方法将指示所检测出的内容特征的标记与媒体对象的多个关键帧相关联。响应于接收到包括搜索项的搜索查询,系统和方法比较搜索项与所选择的关键帧的标记,标识描绘了与搜索项有关的至少一个内容特征的所选择的关键帧,并提供描绘了该至少一个内容特征的媒体项的预览图像。
  • 影视剧内容检索方法和装置-202010280565.5
  • 王建华;卢佳俊;刘广涛;刘东学;王灿 - 北京百度网讯科技有限公司
  • 2020-04-10 - 2023-07-25 - G06F16/738
  • 本申请公开了一种影视剧内容检索方法和装置,涉及知识图谱领域。具体实现方案为:根据各影视剧的实体基础信息生成对应的基础摘要信息;根据各影视剧各子集的子集影视数据,生成与各子集对应的子集摘要信息;根据各影视剧对应的基础摘要信息,以及与各子集对应的子集摘要信息建立影视剧图谱数据库;根据影视剧图谱数据库向用户反馈与影视搜索信息对应的目标影视剧的目标子集播放入口。由此,可以根据影视剧图谱为用户检索到与用户需求匹配的整集影视剧,提升了用户的检索体验。
  • 一种线上课程互动方法及互动平台-202010426932.8
  • 周胜杰 - 深圳康佳电子科技有限公司
  • 2020-05-19 - 2023-07-25 - G06F16/738
  • 本发明提供了一种线上课程互动方法及互动平台,通过客户端发出课程互动请求,服务器接收客户端发出的课程互动请求指令,并响应所述课程互动请求指令,从预先建立的含有多个问答互动片段的课程互动数据库中筛选出与所述知识点关键词对应的问答互动片段;将问答互动片段推送到对应的各个客户端播放。本实施例中,先创建含有老师与学生、学生与学生之间上课互动信息的课堂互动数据库,当学生需要参与互动式学习时,则可以根据所要学习的知识点关键词,从所述课堂互动数据库中查找出与该知识点相关的问答互动片段,从而弥补在线视频教学时老师与学生、学生与学生之间缺乏互动的缺陷,实现更佳的教学互动效果。
  • 一种融合视觉语义信息的视频缩略图推荐方法-202010517202.9
  • 张维刚;张梦琴;王树徽;周延森;黄庆明 - 哈尔滨工业大学(威海)
  • 2020-06-09 - 2023-07-18 - G06F16/738
  • 本发明提供了一种融合视觉语义信息的视频缩略图推荐方法,该方法包括分别对视频概述模型和视频缩略图推荐模型进行训练,得到对应的第一训练结果和第二训练结果;通过所述第一训练结果对当前视频生成概述语句,将所述概述语句与当前视频的关键帧序列同时输入所述第二训练结果,推荐与所述概述语句相关的关键缩略图,结合当前视频的候选缩略图得到当前视频的推荐缩略图序列。本发明弥补了现有视频网站上不能自动为每段视频推荐代表视频主要内容的视频缩略图的缺陷。本方法为视频推荐客观且具有视频内容代表性的视频缩略图序列,从而提高视频的吸引力。
  • 视频处理方法、装置、设备和存储介质-202310257673.4
  • 姚海;赵以诚;施鹏 - 北京百度网讯科技有限公司
  • 2023-03-09 - 2023-07-14 - G06F16/738
  • 本公开提供了一种视频处理方法、装置、设备和存储介质,涉及人工智能技术领域,具体涉及图像处理、视频处理、计算机视觉、深度学习等技术领域。视频处理方法包括:获取视频中的候选图像;基于所述候选图像中的目标对象,对所述候选图像进行聚类处理,以获得至少一个目标类簇,每个目标类簇中包括至少一个候选图像;在所述每个目标类簇包括的至少一个候选图像中,确定目标图像,并将所述目标图像组成视频摘要。本公开可以提高视频摘要的提取效果。
  • 视频标题生成方法、装置、电子设备、存储介质及其产品-202310256734.5
  • 侯志强 - 北京百度网讯科技有限公司
  • 2023-03-08 - 2023-07-14 - G06F16/738
  • 本公开提供了视频标题生成方法、装置、电子设备、存储介质及其产品,涉及大数据处理技术领域,尤其涉及视频数据处理技术领域。视频标题生成方法的具体实现方案为:从待处理视频的视频信息中提取主体词以及所述主体词的特征词;根据所述主体词和所述特征词生成初始标签;所述初始标签包含至少一个主体词和至少一个特征词;根据所述待处理视频的搜索问题从所述初始标签中筛选出目标标签;根据所述目标标签,生成所述待处理视频的标题。
  • 视频处理方法及装置、短视频平台-202010251646.2
  • 李晨曦;李莲莲;王艺鹏;李远杭;郭湘琰;贠挺 - 百度在线网络技术(北京)有限公司
  • 2020-04-01 - 2023-07-14 - G06F16/738
  • 本公开提供了一种视频处理方法,包括:获取待处理视频;从所述待处理视频中获取目标人物出现的多个初始视频片段;针对每个初始视频片段,确定该初始视频片段的每个指定帧图像对应的满足预设规格的目标裁剪区域;根据各指定帧图像对应的目标裁剪区域的位置信息,预测出该初始视频片段的除指定帧图像以外的每个帧图像的目标裁剪区域;根据每个帧图像的目标裁剪区域对每个帧图像进行裁剪,得到对应的目标人物图像;根据该初始视频片段的所有帧图像对应的目标人物图像,生成对应的目标视频片段;至少根据多个目标视频片段,生成目标短视频。本公开还提供了视频处理装置、短视频平台、电子设备及计算机可读介质。
  • 一种视频文本摘要生成方法及装置-201811216586.X
  • 韩世范;刘耀;帅远华;黄毅;曹妍;武建才 - 山西医学期刊社
  • 2018-10-18 - 2023-07-04 - G06F16/738
  • 本发明涉及一种视频文本摘要生成方法及装置,该方法包括:对视频进行分段处理,计算视频帧差值,滤除不包含镜头边界的视频片段,然后比较视频帧差值与阈值,检测视频镜头边界;对视频帧进行图像信息熵计算及角点检测,得到视频帧显著性值,选取镜头内显著性值最高的视频帧作为视频关键帧;利用领域本体对镜头文本进行主题划分,得到视频主题单元;计算视频主题单元中句子的权重,按照句子权重从高到低选取一定比例的句子生成视频文本摘要。本发明生成的视频文本摘要能够更为全面地覆盖视频主要信息,帮助用户快速浏览视频内容,节省时间以及提高效率。
  • 一种基于跨场景知识迁移的在线视频摘要生成方法-202310285928.8
  • 郭斌;郝静怡;於志文;刘思聪;崔禾磊;丁亚三 - 西北工业大学
  • 2023-03-22 - 2023-06-27 - G06F16/738
  • 本发明公开了一种基于跨场景知识迁移的在线视频摘要生成方法,首先,基于轻量级目标检测方法构建多视图视频分割模块,该模块根据目标变化将视频分割成多个镜头表示;然后将包含目标的剪辑镜头输入至摘要生成模块,若模型性能超过特定场景下的性能阈值,模型直接输出基于深度强化学习生成的多视图视频摘要生成结果,否则情境无关的奖励设计模块从动态场景中提取摘要属性,进一步对场景知识进行分析和解耦;随后,动态模型微调模块同时采用表示学习并使用历史数据的样本副本加快模型的再训练以提高泛化能力和动态环境适应能力。最终利用训练完成的多视图视频摘要生成框架,计算视频摘要并输出结果。
专利分类
×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

400-8765-105周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top