[发明专利]视频人物提取方法及装置在审

申请号：	201710882276.0	申请日：	2017-09-26
公开（公告）号：	CN107644213A	公开（公告）日：	2018-01-30
发明（设计）人：	马兆远;郝欣童	申请（专利权）人：	司马大大（北京）智能系统有限公司
主分类号：	G06K9/00	分类号：	G06K9/00;G06K9/62
代理公司：	北京超凡志成知识产权代理事务所(普通合伙)11371	代理人：	王术兰
地址：	100089 北京市***	国省代码：	北京;11
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	视频人物提取方法装置
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【权利要求书】：

1.一种视频人物提取方法，其特征在于，所述视频人物提取方法包括：

提取目标视频中包括人物图像的视频帧图像；

对所述视频帧图像进行图像处理，获得人物特征信息，其中，人物特征信息包括人脸特征信息及人体特征信息；

基于聚类算法对获得的人物特征信息进行聚类处理，得到所述目标视频中所包括的人物聚类结果。

2.如权利要求1所述的视频人物提取方法，其特征在于，所述提取目标视频中包括人物图像的视频帧图像包括：

读取目标视频中的每一帧图像；

通过多个卷积神经网络对读取的每一帧图像进行人脸检测；

根据人脸检测结果筛选出人物图像的视频帧图像。

3.如权利要求2所述的视频人物提取方法，其特征在于，所述对所述视频帧图像进行图像处理，获得人物特征信息包括：

基于卷积神经网络提取所述视频帧图像的人脸特征信息；

提取所述视频帧图像中的行人特征信息。

4.如权利要求3所述的视频人物提取方法，其特征在于，所述通过多个卷积神经网络对每一帧视频帧图像进行人脸检测包括：

在每一帧视频图像中标注人脸位置候选框，生成有人脸位置候选框的图像；

从所述有人脸位置候选框的图像中筛选生成的人脸图像。

5.如权利要求4所述的视频人物提取方法，其特征在于，所述基于聚类算法对获得的人物特征信息进行聚类处理，得到所述目标视频中所包括的人物聚类结果的方式包括以下其中之一或者任意组合：

基于聚类算法对所述人脸特征进行分类，生成人脸特征分类结果；

基于聚类算法对所述行人特征信息进行分类，生成行人特征分类结果；

基于聚类算法对所述人脸特征分类结果和/或所述行人特征分类结果进行分类，生成人物聚类结果。

6.一种视频人物提取装置，其特征在于，所述视频人物提取装置包括：

获取模块，用于提取目标视频中包括人物图像的视频帧图像；

预处理模块，用于对所述视频帧图像进行图像处理，获得人物特征信息，其中，人物特征信息包括人脸特征信息及人体特征信息；

分类模块，用于基于聚类算法对获得的人物特征信息进行聚类处理，得到所述目标视频中所包括的人物聚类结果。

7.如权利要求6所述的视频人物提取装置，其特征在于，所述获取模块包括：

图像读取单元，用于读取目标视频中的每一帧图像；

人脸检测单元，用于通过多个卷积神经网络对读取的每一帧图像进行人脸检测；

图像筛选单元，用于根据人脸检测结果筛选出人物图像的视频帧图像。

8.如权利要求7所述的视频人物提取装置，其特征在于，所述预处理模块包括：

人脸特征提取单元，用于基于卷积神经网络提取所述视频帧图像的人脸特征信息；

行人特征提取单元，用于提取所述视频帧图像中的行人特征信息。

9.如权利要求8所述的视频人物提取装置，其特征在于，所述人脸检测单元包括：

候选框标注子单元，用于在每一帧视频图像中标注人脸位置候选框，生成有人脸位置候选框的图像；

筛选子单元，用于从所述有人脸位置候选框的图像中筛选生成人脸图像。

10.如权利要求9所述的视频人物提取装置，其特征在于，所述分类模块包括：

人脸特征分类单元，用于基于聚类算法对所述人脸特征进行分类，生成人脸特征分类结果；

行人特征分类单元，用于基于聚类算法对所述行人特征信息进行分类，生成行人特征分类结果；

人物分类单元，用于基于聚类算法对所述人脸特征分类结果和/或所述行人特征分类结果进行分类，生成目标视频中所包括的人物聚类结果。

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于司马大大（北京）智能系统有限公司，未经司马大大（北京）智能系统有限公司许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/pat/books/201710882276.0/1.html，转载请声明来源钻瓜专利网。

同类专利

专利分类

G 物理

G06 计算；推算；计数
G06K 数据识别；数据表示；记录载体；记录载体的处理
G06K9-00 用于阅读或识别印刷或书写字符或者用于识别图形，例如，指纹的方法或装置
G06K9-03 .错误的检测或校正，例如，用重复扫描图形的方法
G06K9-18 .应用具有附加代码标记或含有代码标记的打印字符的，例如，由不同形状的各个笔画组成的，而且每个笔画表示不同的代码值的字符
G06K9-20 .图像捕获
G06K9-36 .图像预处理，即无须判定关于图像的同一性而进行的图像信息处理
G06K9-60 .图像捕获和多种预处理作用的组合

免登录下载普通用户下载升级VIP会员，免费下载

[发明专利]视频人物提取方法及装置在审

专利文献下载