[发明专利]视频分类方法、装置、存储介质及终端设备在审

专利信息
申请号: 202110321242.0 申请日: 2021-03-25
公开(公告)号: CN113032627A 公开(公告)日: 2021-06-25
发明(设计)人: 王栋 申请(专利权)人: 北京小米移动软件有限公司;北京小米松果电子有限公司
主分类号: G06F16/75 分类号: G06F16/75;G06F16/783;G06K9/62
代理公司: 北京英创嘉友知识产权代理事务所(普通合伙) 11447 代理人: 卢夏子
地址: 100085 北京市海淀*** 国省代码: 北京;11
权利要求书: 查看更多 说明书: 查看更多
摘要: 本公开涉及一种视频分类方法、装置、存储介质及终端设备,该方法包括:通过终端获取目标视频;获取目标视频对应的图像特征向量、音频特征向量以及文本特征向量;将图像特征向量、音频特征向量以及文本特征向量按照第一预设拼接顺序进行拼接,得到该目标视频对应的第一特征向量;通过预先训练的特征融合模型,将图像特征向量、音频特征向量以及文本特征向量进行融合,得到该目标视频对应的第二特征向量;将第一特征向量和第二特征向量按照第二预设拼接顺序进行拼接,得到目标视频对应的第三特征向量;根据第三特征向量和预先训练的视频分类模型,确定目标视频对应的类别。这样,可以防止目标视频中信息的丢失,从而提高了视频分类的准确率。
搜索关键词: 视频 分类 方法 装置 存储 介质 终端设备
【主权项】:
暂无信息
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京小米移动软件有限公司;北京小米松果电子有限公司,未经北京小米移动软件有限公司;北京小米松果电子有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/patent/202110321242.0/,转载请声明来源钻瓜专利网。

同类专利
  • 视频文件的分类方法、装置、介质及电子设备-202010224680.0
  • 潘跃;李政;常德丹 - 腾讯科技(深圳)有限公司
  • 2020-03-26 - 2023-10-24 - G06F16/75
  • 本申请提供一种视频文件的分类方法、视频文件的分类装置、计算机可读存储介质及电子设备;涉及视频处理技术领域;包括:当检测到上传的视频文件时,获取视频文件对应的描述信息和用户信息,解码视频文件得到对应的音频内容以及视频帧集合;对音频内容进行文本识别得到音频内容对应的文本信息,对文本信息和描述信息进行分词得到分词集合;根据视频帧集合和分词集合生成视频文件对应的第一分类结果,根据音频内容生成视频文件对应的第二分类结果,根据用户信息生成视频文件对应的第三分类结果;根据上述分类结果对视频文件进行分类。上述方法可以通过视频文件的多维度信息对视频文件进行识别,以提升对于视频文件的识别准确率。
  • 视频分类方法、装置、电子设备及存储介质-202110707843.5
  • 吴文灏;夏博洋 - 北京百度网讯科技有限公司
  • 2021-06-24 - 2023-10-20 - G06F16/75
  • 本公开提出了一种视频分类方法、装置、电子设备及存储介质,涉及计算机视觉和深度学习技术领域。具体实现方案为:获取待分类的视频,并从所述视频中获取至少一个视频片段;获取每个所述视频片段对应的图像‑音频对;获取每个所述图像‑音频对的特征信息;所述特征信息用于表征与所述图像‑音频对对应的视频片段;根据每个所述图像‑音频对的特征信息,从所述至少一个视频片段中筛选出至少一个显著性视频片段;根据所述至少一个显著性视频片段对所述视频进行分类。本方案可以大幅度减少视频分类的计算量,实现了视频分类准确率和计算量的均衡。
  • 内容生态指数分割阈值的确定方法、装置、设备和介质-202110358072.3
  • 李雪雪 - 广州虎牙科技有限公司
  • 2021-04-01 - 2023-10-17 - G06F16/75
  • 本发明实施例公开了一种内容生态指数分割阈值的确定方法、装置、设备和介质。该方法包括:获取目标时间段内每个目标品类按照预设周期统计的各内容生态指数以及与内容生态指数分别匹配的至少一种关系指数;根据各个目标品类的内容生态指数确定内容生态指数分割初始阈值;根据内容生态指数分割初始阈值对每个目标品类的每个内容生态指数进行分类标记,并根据内容生态指数和至少一种关系指数对每个目标品类的每个内容生态指数进行聚类标记;如果分类标记结果与聚类标记结果的匹配率低于预设阈值,则对内容生态指数分割初始阈值进行优化,以得到内容生态指数分割目标阈值。上述技术方案提高了内容生态指数分割阈值的精准性。
  • 视频分类方法、装置及电子设备-201910921207.5
  • 李伟健;王长虎 - 北京字节跳动网络技术有限公司
  • 2019-09-27 - 2023-10-13 - G06F16/75
  • 本公开实施例中提供了一种视频分类方法、装置及电子设备,属于数据处理技术领域,该方法包括:基于视频平台针对不同视频的热度值,获取热度值超过预设值的目标视频和所述视频平台针对所述目标视频生成的推荐值;利用预设的分类网络对量化处理后的推荐值进行特征计算,得到与所述推荐值相关的第一特征值;利用所述分类网络对所述目标视频进行特征计算,得到与所述目标视频相关的第二特征值;将所述第一特征值和所述第二特征值合并形成的第三特征值,作为所述分类全连接层的输入特征,来进一步的判断所述目标视频的分类。通过本公开的方案,能够提高视频分类的准确度。
  • 视频作品分类方法、装置、设备及介质-202310855071.9
  • 刘仁鹏 - 北京达佳互联信息技术有限公司
  • 2023-07-12 - 2023-10-10 - G06F16/75
  • 本公开关于一种视频作品分类方法、装置、设备及介质,用以解决相关技术中如果用户不设置则不会被纳入标签聚合页展示,且同义标签消费场景离散,不够聚合收敛,致使作品分类体现不完善,不利于对作品的整理与罗列,影响用户体验的问题。所述方法包括:获取创作者上传的视频作品数据;对所述视频作品数据进行分析,确定所述视频作品数据对应的主题;将所述视频作品数据存储于所述主题对应的主题作品池中。
  • 识别机器人账号的方法、装置、电子设备及计算机可读存储介质-202010519903.6
  • 韩立伟;王世明 - 北京奇艺世纪科技有限公司
  • 2020-06-09 - 2023-10-03 - G06F16/75
  • 本发明实施例提供了一种识别机器人账号的方法、装置、电子设备及计算机可读存储介质,该方法包括:获取待识别账号的头像以作为确定为待识别图像;采用第一图像相似度算法,从待识别图像中选出候选图像对,其中,候选图像对中包括的两个待识别图像的相似度大于第一预设相似度;采用第二图像相似度算法,从候选图像对中选出相似图像对,相似图像对包括的两个待识别图像的相似度大于第二预设相似度;获取目标账号在网络平台上传数据的行为信息,目标账号为相似图像对中包括的待识别图像所属的待识别账号;根据行为信息,识别目标账号中的机器人账号。因此,本发明的方案,可以在一定程度上提升识别机器人账号的准确度。
  • 基于多算法引擎的人员聚档方法、装置及可读存储介质-202310801488.7
  • 请求不公布姓名 - 北京瑞莱智慧科技有限公司
  • 2023-07-03 - 2023-09-29 - G06F16/75
  • 本发明公开了一种基于多算法引擎的人员聚档方法、装置及可读存储介质,该方法包括:利用主算法引擎从监控视频中提取出待聚档的多个人员图像;利用辅助算法引擎从待聚档的每个人员图像中提取出对应的特征信息;根据提取出的特征信息,分别计算待聚档的任意两个人员图像的拟合相似度;利用人员聚档算法处理计算得到的拟合相似度,以对所述待聚档的多个人员图像进行聚类分组;本发明能够依靠多个算法引擎提高人员聚档的效率和准确性。
  • 电子标签数据的处理方法、装置、电子设备及存储介质-202010746558.X
  • 邵帅 - 北京达佳互联信息技术有限公司
  • 2020-07-29 - 2023-09-26 - G06F16/75
  • 本公开关于一种电子标签数据的处理方法、装置、电子设备及存储介质,其中,所述方法包括:获取针对视频数据的电子标签进行交互操作的相关数据;根据相关数据的数量实时更新第一数据表和第二数据表;按照周期从第一数据表中读取出修正数据;根据修正数据得到聚合结果;按照聚合结果覆盖第二数据表中对应的计数数据项。本公开根据相关数据实时更新第一数据表和第二数据表,保证第一数据表和第二数据表中数据的实时性。当需要展示一特定条件的电子标签数据时,可以从第二数据表的计数数据项中直接读取得到对应的数据内容,避免在线计算得到电子标签数据,缩短获得电子标签数据的耗时。
  • 一种短视频分类方法-201910737582.4
  • 孙伟芳 - 央视国际网络无锡有限公司
  • 2019-08-12 - 2023-09-26 - G06F16/75
  • 本发明是一种短视频分类方法,该方法包括以下步骤:一、视频切变帧提取:提取视频不同场景画面的帧,先寻找切变镜头帧以及渐变镜头帧,然后抽取镜头帧时间位置的往后N秒的场景帧;二、图片物体识别:使用现有架构中的现有的物体识别的模型,使用以卷积神经网络为核心基础的算法进行训练保存模型预测图片;三、基于物体识别的视频分类算法:由步骤一、二两部分的结果输入,并根据输入结果进行视频分类的启发式算法。本发明的优点:用于特色短视频分类,计算复杂性和时间较小,占用资源少,可满足不同用户对于短视频类别分类需求,解决了视频数据集搜集、保存、处理过程中的问题。
  • 一种视频处理方法、装置、计算机设备以及可读存储介质-202210203264.1
  • 陈小帅 - 腾讯科技(深圳)有限公司
  • 2022-03-02 - 2023-09-19 - G06F16/75
  • 本申请实施例提供了一种视频处理方法、装置、计算机设备以及可读存储介质,该方法涉及云技术、人工智能、智慧交通、视频、搜索技术等领域,方法包括:从目标视频中获取目标视频片段,根据目标评论性媒体数据和目标片段内容,对目标视频片段进行评论类型检测,得到类型检测结果;若类型检测结果指示目标评论性媒体数据与目标片段内容之间的关联关系满足热点评论条件,则确定目标视频片段为具有热点评论类型的视频片段;从视频片段库中获取与目标视频片段满足片段相似热点评论条件的视频片段,将满足片段相似热点评论条件的视频片段确定为相似评论片段集合。采用本申请,可以丰富与目标视频片段相关联的视频资源,提高所挖掘出的视频片段的准确度。
  • 一种基于负反馈的用户反感标签确定方法-202310268646.7
  • 宫婧;何涛;孙知信;孙哲;曹亚东;赵学健;汪胡青;胡冰;徐玉华 - 南京邮电大学
  • 2023-03-20 - 2023-09-15 - G06F16/75
  • 本发明公开了一种基于负反馈的用户反感标签确定方法包括,采集数据信息,根据数据信息设置滑动时间窗;获取时间窗内用户的负反馈行为关联视频数据,统计单个标签频次、总标签频次;计算用户视频反感权重,获取用户标签反感权重;计算用户标签反感程度值,确定用户最终反感标签。本方法具有实时性高的特点,通过一个动态的时间窗,不断计算用户近期的反感意图,能够准确表达用户近期的负反馈指向,降低向用户推荐反感视频比例。
  • 视频分类方法、视频分类装置、存储介质与电子设备-201911168580.4
  • 彭冬炜 - OPPO广东移动通信有限公司
  • 2019-11-25 - 2023-09-15 - G06F16/75
  • 本公开提供了一种视频分类方法、视频分类装置、存储介质与电子设备,涉及计算机视觉技术领域。该方法包括:从待分类视频中获取多个关键帧图像;利用预先训练的卷积神经网络,分别从所述多个关键帧图像中提取特征;按照所述多个关键帧图像在所述待分类视频中的时间戳,排列各所述关键帧图像对应的特征,得到特征序列;根据所述特征序列中每个特征的注意力权重,对所述特征序列进行处理,得到所述待分类视频的分类结果。本公开可以在视频分类中,根据关键帧之间的时间分布信息挖掘出关键帧图像排列所产生的语义,提高视频分类结果的准确度。
  • 一种视频图像数据治理方法-201911349702.X
  • 孙丽丽;刘庆伟;张亨通;李斌;万晓松;张波涛;刘亚光;黄杰;庄超明;赵惠芳;程功 - 北京中盾安全技术开发公司
  • 2019-12-24 - 2023-09-15 - G06F16/75
  • 本发明公开了一种视频图像数据治理方法。方法包括数据质量治理,从若干异构视频图像数据源中采集构建业务元数据,包括数据标准、数据模型和数据质量规则;对异构数据源数据进行分类,区分出视频图像基础属性、视频图像描述信息和视频图像原始数据;本发明所述方法的优越效果是:提供了一种视频图像数据治理方法,结合接入汇聚视频图像数据的方式特点和内容特点,对视频图像数据通过一系列数据质量管理手段和数据资产管理功能进行治理,构建出视频图像数据分级分类后的资产目录,为后续围绕视频图像数据的应用提供数据上的支撑。
  • 视频标签确定方法、装置、终端及存储介质-202010052109.5
  • 李翰;李亚乾;蒋燚 - OPPO广东移动通信有限公司
  • 2020-01-17 - 2023-09-08 - G06F16/75
  • 本申请涉及一种视频标签确定方法、装置、终端及存储介质,属于计算机技术领域。该方法包括:获取待处理视频;提取待处理视频中多个第一目标帧图像之间的时序特征信息,时序特征信息为根据不同时间点的第一目标帧图像的特征差异确定的信息;根据时序特征信息,生成用于描述待处理视频对应的动态事件的动态事件描述文本;根据动态事件描述文本,确定待处理视频的视频标签。通过获取待处理视频中动态事件描述文本,确定待处理视频的视频标签,更深度地挖掘了视频信息,以便用户可以更准确、更便利地管理视频。
  • 多模态增强的视频分类方法、系统、存储介质及电子设备-202310927018.5
  • 孔欧 - 上海蜜度信息技术有限公司
  • 2023-07-27 - 2023-09-05 - G06F16/75
  • 本发明提供一种多模态增强的视频分类方法、系统、存储介质及电子设备,所述方法包括以下步骤:获取包含音频和文本的视频;提取所述视频的视频特征和音频特征;对所述视频特征和所述音频特征进行多次融合,获取第一融合特征和第二融合特征;提取所述文本的文本特征;基于所述第一融合特征、所述第二融合特征和所述文本特征获取所述视频的分类结果。本发明的多模态增强的视频分类方法、系统、存储介质及电子设备通过兼顾视频的视频特征、音频特征和文本特征来实现分类,有效提升了分类效果。
  • 一种视频分类方法、装置、电子设备及存储介质-202110863765.8
  • 姜健;宛言 - 北京达佳互联信息技术有限公司
  • 2021-07-29 - 2023-09-05 - G06F16/75
  • 本公开关于一种视频分类方法、装置、电子设备及存储介质,涉及计算机技术领域,该方法包括:确定目标图片的图片特征和目标文本的文本特征,该图片特征中包括长度特征、宽度特征以及通道数特征,该目标图片为待分析视频对应的多个图片中的一个,该目标文本为该目标图片对应的文本;将该图片特征和该文本特征融合,以得到融合特征;根据该融合特征,确定该待分析视频的类别。本公开中,通过多种特征的融合,能够全面地体现出图片和文本对视频分类的影响,可以准确地确定出待分析视频的类别,进而提升产品推荐的有效性。
  • 一种视频分类方法、装置、设备和存储介质-201911228426.1
  • 迟至真;李甫;孙昊;何栋梁;龙翔;周志超;王平 - 北京百度网讯科技有限公司
  • 2019-12-04 - 2023-09-05 - G06F16/75
  • 本申请公开了一种视频分类方法、装置、设备和存储介质,涉及视频分类技术领域。具体实现方案为:对待分类视频进行抽帧处理,得到待分类视频的多个视频帧的帧数据;将待分类视频的多个视频帧的帧数据输入至预先训练出的特征抽取模型,获得待分类视频的特征数据;特征抽取模型包括TSM模型;TSM模型的各时序卷积层对本层的输入数据进行方向随机的时序偏移操作;将特征数据输入至预先训练出的序列模型,得到待分类视频的分类结果。本申请实施例特征抽取时引入TSM模型,在TSM模型的各时序卷积层对各层输入数据进行方向随机的时序偏移操作,有利于数据增广,使所抽取的特征数据更加丰富全面,进而提升了视频分类结果的准确度。
  • 视频分类方法、视频分类装置、电子设备及存储介质-202310674376.X
  • 张旭龙;王健宗;程宁;赵嘉豪 - 平安科技(深圳)有限公司
  • 2023-06-07 - 2023-08-29 - G06F16/75
  • 本申请实施例提供了一种视频分类方法、视频分类装置、电子设备及存储介质,属于金融科技领域。该方法包括:获取目标视频和用于描述目标视频的视频描述数据;对目标视频进行数据提取,得到目标视频的图像数据和音频数据;基于图像数据和音频数据进行视频内容提取,得到目标视频的视频内容特征;基于音频数据进行视频声学特征提取,得到目标视频的目标声学特征;对视频描述数据进行描述内容提取,得到目标视频的描述文本特征;基于注意力网络对视频内容特征、目标声学特征和描述文本特征进行特征融合,得到目标视频特征;基于视频分类器和目标视频特征对目标视频进行视频分类,得到目标视频的目标视频类别。本申请能够提高视频分类的准确性。
  • 用于处理视频的方法和装置-201910204127.8
  • 李伟健;王长虎 - 北京字节跳动网络技术有限公司
  • 2019-03-18 - 2023-08-29 - G06F16/75
  • 本公开的实施例公开了用于处理视频的方法和装置。该方法的一具体实施方式包括:获取视频;将视频输入预先训练的视频分类模型,以得到类别信息和概率值,其中,类别信息用于指示视频所属的视频类别,概率值用于表征视频属于视频类别的概率;以及响应于确定概率值大于等于预设的概率阈值,将视频发送到预先与视频类别建立对应关系的标注终端。该实施方式实现了将机器识别和人工标注相结合,有针对性地将视频发送到相应的标注终端,有助于提高对视频进行标注的准确性和效率,同时降低了因使用电子设备对视频进行人工标注所占用的时间,从而节约了电子设备的硬件资源。
  • 视频化脚本语义结构的组装方法、系统和电子装置-202110917687.5
  • 赵艳;徐志丰 - 赞同科技股份有限公司
  • 2021-08-11 - 2023-08-25 - G06F16/75
  • 本发明涉及视频播放、教育培训和软件管理系统领域,尤其涉及一种视频化脚本语义结构的组装方法、系统及与之相关的电子装置和存储介质。本发明视频化脚本语义结构的组装方法包括:提取视频对象需要具备的基础知识和概念集,并对其进行筛选和归类,构建知识库并设置关键词索引,分解视频内容并提取各步骤的关键性标题,构建视频内容文字说明,视频内容脚本线性组装等步骤。本发明方法极大地方便了脚本编写人员对重复内容的复用,显著缩短了编写时间,并为视频内容的后续修改、视频制作和视频库的检索提供了更大的空间和更多的便利。
  • 一种用于数据库平台的诗词分类方法及系统-202310603697.0
  • 严磊;张溢蔓;严胜强;张乐;卢梦月;彭伟杰 - 杭州晨星创文网络科技有限公司
  • 2023-05-22 - 2023-08-22 - G06F16/75
  • 本发明提出了一种用于数据库平台的诗词分类方法及系统,涉及诗词平台领域。包括获取多个诗词的诗词类型,包括作者朝代、年级课程、诗词地区、诗词作者和专辑收录风格中的一项或多项;根据多个诗词的类型分析各诗词的关联内容并提取关键词;采集多组诗词分类数据,每组数据均包括诗词内容和诗词类型;多组诗词分类数据通过机器学习训练得到诗词分类模型;通过诗词分类模型获得各诗词的类型后,验证输出结果是否正确;当不正确时重新确定关联内容和多个关键词;采集多组诗词识别数据,每组数据均包括诗词内容、关联内容、多个关键词和诗词类型;多组诗词识别数据通过机器学习训练得到诗词识别模型,能够识别诗词类型便于管理。
  • 基于多模态知识蒸馏的短视频多标签分类方法及装置-202310545873.X
  • 苏育挺;马潇;井佩光 - 天津大学
  • 2023-05-16 - 2023-08-15 - G06F16/75
  • 本发明公开了一种基于多模态知识蒸馏的短视频多标签分类方法及装置,方法包括:教师神经网络和学生网络的损失函数包括第一次知识迁移中特征层中各模态之间的损失和第二次知识迁移教师网络和学生网络之间特征表征输出的重构损失,以及学生网络最终分类损失,并以此目标函数指导学生网络寻找学生网络模型的最优解;运用反向传播计算输出层目标函数结果与真实值之间的偏差,进行逐层调节参数,最终求出学生网络模型的局部最优解;基于局部最优解得到由教师网络训练蒸馏出的最佳学生网络模型,并将最佳学生网络运用到短视频多标签分类中,输出短视频多标签的分类结果。装置包括:处理器和存储器。本发明提高了短视频多标签分类任务的准确度,具有重要的实际应用价值。
  • 视频标签的确定方法、装置和计算机设备-201911307828.0
  • 刘呈祥;何伯磊;肖欣延 - 北京百度网讯科技有限公司
  • 2019-12-17 - 2023-08-11 - G06F16/75
  • 本申请提出一种视频标签的确定方法、装置和计算机设备,涉及数据处理技术领域,其中,方法包括:对视频进行主题识别,得到根据视频的标题、图像内容、文本内容、用户标注信息和视频分类中的多个确定的第一标签,根据第一标签,查询相关的第二标签,将第一标签和第二标签作为候选标签提取排序特征,根据排序特征,对各候选标签排序,根据排序从各候选标签中确定视频的目标标签,通过对视频的多维度信息识别确定第一标签,并根据第一标签查询相关的第二标签,基于第一标签和第二标签对应的多重有效信息,进行综合判断,提升了视频标签确定的准确性和标签的完整性,解决现有技术中标题信息不足或者误导带来的视频标签确定错误和漏召回的技术问题。
  • 一种基于多实例学习和标签关系图的多标签视频分类方法-202210092357.1
  • 徐成;吴宏俊;刘宏哲;徐冰心;潘卫国;代松银 - 北京联合大学
  • 2022-01-26 - 2023-08-08 - G06F16/75
  • 本申请涉及一种基于多实例学习和标签关系图的多标签视频分类方法,包括以下步骤:获取待分类视频的每一帧特征;将所述视频的每一帧特征视为一个实例,将所有的帧特征合并为包级特征对视频进行表示;将视频的所述包级特征映射为每个视频分类标签的内容感知类别表示;学习所述视频分类标签的关系,构建标签关系图,并采用标签关系卷积神经网络从相应的内容感知类别表示中增强当前视频特征,获得每一个分类标签的概率得分;将所述的每一个分类标签的概率得分和设定阈值进行比对,确定所述待分类视频最终的标签。本申请可以根据当前对象动态学习,从而可以纠正多标签视频预测中的频率偏差,使得视频最终的分类标签更加准确。
  • 一种基于知识培训平台的课程评估方法-202310163788.7
  • 朱峻修 - 广州沐思信息科技有限公司
  • 2023-02-24 - 2023-07-25 - G06F16/75
  • 本发明涉及视频评估领域,具体涉及一种基于知识培训平台的课程评估方法,通过在平台上获取提交课程视频,并对课程视频进行分类,将所述课程视频文件按分类进行划分,并且获取划分区域时间,将所述视频帧分类后的区域时间进行判断,并对所述判断获取评分,根据初步评分结合客户端的访问情况进行结合,得到课程评估结果,通过课程评估结果对所述课程系统中的资源进行分配,通过上述方法解决了原有技术方案中课程视频的评分的不客观性,并且通过新的评估机制得到的评分通过平台新的资源进行分配,让用户可以在平台中获取更好的教育资源,并且简化了用户寻找资源的渠道,让用户更好的体验更好的教育课程视频。
  • 一种视频分类方法、视频分类装置、电子设备及存储介质-202010572195.2
  • 尹康;吴宇斌;郭烽 - OPPO广东移动通信有限公司
  • 2020-06-22 - 2023-07-25 - G06F16/75
  • 本申请实施例公开了一种视频分类方法、视频分类装置、电子设备及存储介质,该方法包括:获取待分类视频对应的至少两个初始视频特征向量;将第一初始视频特征向量输入至第一目标多分类模型,得到待分类视频的初始分类标签向量;至少两个初始视频特征向量包括第一初始视频特征向量;初始分类标签向量包括待分类视频中不同的目标对象对应的第一标签值;根据初始分类标签向量和第二初始视频特征向量,获取待分类视频的目标特征向量;第二初始视频特征向量包括至少两个初始视频特征向量中除第一初始视频特征向量外的视频特征向量;将目标特征向量输入至第二目标多分类模型,获取待分类视频中目标对象的类别信息,得到待分类视频的目标分类结果。
  • 一种基于时域信息增强的多模态微视频分类方法-202310378403.9
  • 张博;张伟;朱志良;于海 - 东北大学
  • 2023-04-11 - 2023-07-21 - G06F16/75
  • 本发明提供一种基于时域信息增强的多模态微视频分类方法,涉及视频分类技术领域。该方法首先将待分类微视频切分成多个视频片段;再分离视频片段中的视觉模态、音频模态和文本模态信息,并提取视觉模态特征、音频模态特征和文本模态特征;然后基于各视频片段的视觉模态特征和音频模态特征,选取最具表达力的视频片段;捕捉最具表达力的视频片段的视觉模态和音频模态的时间域相关信息,得到时域信息增强的特征矩阵;最后将时域信息增强的视觉模态特征、音频模态特征与原始的文本模态特征进行融合,得到最终的分类结果。该方法充分的利用了视频的音频和文本模态,对图像信息进行了补充,进一步的提高了分类精度。
  • 预训练模型以及体感画风识别模型的训练方法及装置-202210572644.2
  • 刘刚 - 腾讯科技(深圳)有限公司
  • 2022-05-25 - 2023-07-18 - G06F16/75
  • 本申请涉及一种预训练模型以及体感画风识别模型的训练方法及装置。所述方法包括:获取各样本数据对,样本数据对包括内容图样本以及与内容图样本对应的数据描述信息;获取各样本数据对中的内容图样本对应的内容分类标签;对各样本数据对以及各内容图样本对应的内容分类标签进行特征提取,获得各内容图样本的样本特征,样本特征包括图像特征和文本特征;基于各内容图样本的样本特征,对初始预训练模型进行训练,得到目标预训练模型,目标预训练模型用于训练获得体感画风识别模型,体感画风识别模型识别数据信息的体感画风类别。采用本方法能够保证对体感画风进行识别的准确度。
专利分类
×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

400-8765-105周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top