[发明专利]视频特征学习方法、装置、电子设备及可读存储介质有效
申请号: | 201810047987.0 | 申请日: | 2018-01-18 |
公开(公告)号: | CN108280163B | 公开(公告)日: | 2020-07-28 |
发明(设计)人: | 丁大钧;赵丽丽;刘旭 | 申请(专利权)人: | 厦门美图之家科技有限公司 |
主分类号: | G06F16/78 | 分类号: | G06F16/78;G06F16/783;G06N3/08 |
代理公司: | 北京超凡志成知识产权代理事务所(普通合伙) 11371 | 代理人: | 魏彦 |
地址: | 361000 福建省厦门市*** | 国省代码: | 福建;35 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 视频 特征 学习方法 装置 电子设备 可读 存储 介质 | ||
本发明实施例提供一种视频特征学习方法、装置、电子设备及可读存储介质。该方法包括:获得待训练的视频样本,所述视频样本包括有多帧图像;对所述视频样本进行分段,得到多个连续的视频分段;针对各视频分段,提取各视频分段的视觉特征,并计算各视频分段的运动基元数量;针对所述视频样本,提取所述视频样本的视觉特征,并计算所述视频样本的运动基元数量;基于各视频分段的运动基元数量、所述视频样本的运动基元数量和预设约束条件对目标分类模型进行训练,得到训练后的目标分类模型,以实现对视频特征的学习。由此,无需获知视频的标签和分类信息就可以实现视频特征的无监督学习,降低资源和成本消耗,并且可以适应于广泛的视频场景。
技术领域
本发明涉及计算机技术领域,具体而言,涉及一种视频特征学习方法、装置、电子设备及可读存储介质。
背景技术
视频特征学习具有广泛的应用领域,例如可包括视频分类、相似视频检索、视频匹配等。目前的视频特征学习方法主要是基于视频标签和分类信息,而上述视频标签和分类信息需要人工标注作业,在数据量巨大的实际业务应用场景,非常消耗资源和成本。
发明内容
为了克服现有技术中的上述不足,本发明的目的在于提供一种视频特征学习方法、装置、电子设备及可读存储介质,无需获知视频的标签和分类信息就可以实现视频特征的无监督学习,降低资源和成本消耗,并且可以适应于广泛的视频场景。
为了实现上述目的,本发明较佳实施例采用的技术方案如下:
本发明较佳实施例提供一种视频特征学习方法,应用于电子设备,所述方法包括:
获得待训练的视频样本,所述视频样本包括有多帧图像;
对所述视频样本进行分段,得到多个连续的视频分段,其中,每个所述视频分段对应至少一个运动基元,所述运动基元为针对所述视频样本,基于动作分解得到的视觉基础单元;
针对各视频分段,提取各视频分段的视觉特征,并计算各视频分段的运动基元数量;
针对所述视频样本,提取所述视频样本的视觉特征,并计算所述视频样本的运动基元数量;
基于各视频分段的运动基元数量、所述视频样本的运动基元数量和预设约束条件对目标分类模型进行训练,得到训练后的目标分类模型,以实现对视频特征的学习。
在本发明较佳实施例中,所述提取各视频分段的视觉特征的方式,包括:
通过预先配置的特征提取模型或者深度学习模型将各视频分段中的各帧图像信息进行融合后提取各视频分段的视觉特征。
在本发明较佳实施例中,所述计算各视频分段的运动基元数量的方式,包括:
将所述各视频分段的视觉特征输入到预先配置的运动基元计算模型,得到各视频分段的运动基元数量。
在本发明较佳实施例中,所述基于各视频分段的运动基元数量、所述视频样本的运动基元数量和预设约束条件对目标分类模型进行训练,得到训练后的目标分类模型,包括:
基于各视频分段的运动基元数量和所述视频样本的运动基元数量对目标分类模型进行训练;
在训练过程中根据预设损失函数计算该目标分类模型的Loss值,直到所述Loss值小于预设值时结束训练,得到训练后的目标分类模型,其中,当所述Loss值小于预设值时,所述训练后的目标分类模型满足所述预设约束条件。
在本发明较佳实施例中,所述预设损失函数为:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于厦门美图之家科技有限公司,未经厦门美图之家科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810047987.0/2.html,转载请声明来源钻瓜专利网。