[发明专利]视频人物提取方法及装置在审
申请号: | 201710882276.0 | 申请日: | 2017-09-26 |
公开(公告)号: | CN107644213A | 公开(公告)日: | 2018-01-30 |
发明(设计)人: | 马兆远;郝欣童 | 申请(专利权)人: | 司马大大(北京)智能系统有限公司 |
主分类号: | G06K9/00 | 分类号: | G06K9/00;G06K9/62 |
代理公司: | 北京超凡志成知识产权代理事务所(普通合伙)11371 | 代理人: | 王术兰 |
地址: | 100089 北京市*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 视频 人物 提取 方法 装置 | ||
1.一种视频人物提取方法,其特征在于,所述视频人物提取方法包括:
提取目标视频中包括人物图像的视频帧图像;
对所述视频帧图像进行图像处理,获得人物特征信息,其中,人物特征信息包括人脸特征信息及人体特征信息;
基于聚类算法对获得的人物特征信息进行聚类处理,得到所述目标视频中所包括的人物聚类结果。
2.如权利要求1所述的视频人物提取方法,其特征在于,所述提取目标视频中包括人物图像的视频帧图像包括:
读取目标视频中的每一帧图像;
通过多个卷积神经网络对读取的每一帧图像进行人脸检测;
根据人脸检测结果筛选出人物图像的视频帧图像。
3.如权利要求2所述的视频人物提取方法,其特征在于,所述对所述视频帧图像进行图像处理,获得人物特征信息包括:
基于卷积神经网络提取所述视频帧图像的人脸特征信息;
提取所述视频帧图像中的行人特征信息。
4.如权利要求3所述的视频人物提取方法,其特征在于,所述通过多个卷积神经网络对每一帧视频帧图像进行人脸检测包括:
在每一帧视频图像中标注人脸位置候选框,生成有人脸位置候选框的图像;
从所述有人脸位置候选框的图像中筛选生成的人脸图像。
5.如权利要求4所述的视频人物提取方法,其特征在于,所述基于聚类算法对获得的人物特征信息进行聚类处理,得到所述目标视频中所包括的人物聚类结果的方式包括以下其中之一或者任意组合:
基于聚类算法对所述人脸特征进行分类,生成人脸特征分类结果;
基于聚类算法对所述行人特征信息进行分类,生成行人特征分类结果;
基于聚类算法对所述人脸特征分类结果和/或所述行人特征分类结果进行分类,生成人物聚类结果。
6.一种视频人物提取装置,其特征在于,所述视频人物提取装置包括:
获取模块,用于提取目标视频中包括人物图像的视频帧图像;
预处理模块,用于对所述视频帧图像进行图像处理,获得人物特征信息,其中,人物特征信息包括人脸特征信息及人体特征信息;
分类模块,用于基于聚类算法对获得的人物特征信息进行聚类处理,得到所述目标视频中所包括的人物聚类结果。
7.如权利要求6所述的视频人物提取装置,其特征在于,所述获取模块包括:
图像读取单元,用于读取目标视频中的每一帧图像;
人脸检测单元,用于通过多个卷积神经网络对读取的每一帧图像进行人脸检测;
图像筛选单元,用于根据人脸检测结果筛选出人物图像的视频帧图像。
8.如权利要求7所述的视频人物提取装置,其特征在于,所述预处理模块包括:
人脸特征提取单元,用于基于卷积神经网络提取所述视频帧图像的人脸特征信息;
行人特征提取单元,用于提取所述视频帧图像中的行人特征信息。
9.如权利要求8所述的视频人物提取装置,其特征在于,所述人脸检测单元包括:
候选框标注子单元,用于在每一帧视频图像中标注人脸位置候选框,生成有人脸位置候选框的图像;
筛选子单元,用于从所述有人脸位置候选框的图像中筛选生成人脸图像。
10.如权利要求9所述的视频人物提取装置,其特征在于,所述分类模块包括:
人脸特征分类单元,用于基于聚类算法对所述人脸特征进行分类,生成人脸特征分类结果;
行人特征分类单元,用于基于聚类算法对所述行人特征信息进行分类,生成行人特征分类结果;
人物分类单元,用于基于聚类算法对所述人脸特征分类结果和/或所述行人特征分类结果进行分类,生成目标视频中所包括的人物聚类结果。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于司马大大(北京)智能系统有限公司,未经司马大大(北京)智能系统有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710882276.0/1.html,转载请声明来源钻瓜专利网。