[发明专利]一种基于视觉注意理论的自适应下采样方法及装置有效
申请号: | 201810379089.5 | 申请日: | 2018-04-25 |
公开(公告)号: | CN108537209B | 公开(公告)日: | 2021-08-27 |
发明(设计)人: | 姬秋敏;张灵;陈云华 | 申请(专利权)人: | 广东工业大学 |
主分类号: | G06K9/00 | 分类号: | G06K9/00;G06T7/269 |
代理公司: | 北京集佳知识产权代理有限公司 11227 | 代理人: | 张春水;唐京桥 |
地址: | 510060 广东*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 视觉 注意 理论 自适应 采样 方法 装置 | ||
本发明提供一种基于视觉注意理论的自适应下采样方法及装置,该方法包括:通过全局光流法度量视频片段的表情变化量;通过离散余弦变换方法把视频片段的表情变化量转换到频域空间,获取频域上的表情信息量指标;根据频域上的表情信息量指标确定视频片段的下采样因子。本发明把时域的表情信息量转换到频域上,通过频率分析来获得自适应下采样因子,因此更好的模拟了人类的注意力,采样获取的表情帧表情表征能力更强,用于解决现有技术不适用于无峰值表情帧标注的连续自发式表情识别的技术问题。
技术领域
本发明涉及面部识别技术领域,尤其涉及一种基于视觉注意理论的自适应下采样方法及装置。
背景技术
一方面,面部表情识别在医疗、公共安全、人机交互等领域有着广泛的应用前景,因而其研究具有现实意义;另一方面,表情识别问题的解决涉及到图像处理、计算机视觉、优化理论等领域中的许多基本问题,例如图像配准、图像分割、图像特征提取、机器学习、最优化算法等,因而其研究具有重要的理论意义。动态连续自发式(spontaneous)表情识别相对于静态摆拍式(posed)表情识别,因其具有更大的研究挑战性和更高的应用价值,近年来,已经成为表情识别的研究重点。作为最新的自发式表情数据集,音视频情感挑战(Audio/Visual Emotion Challenge,AVEC),收录了约150万帧视频,视频中脸部表情自然细微,数据集未对峰值表情帧进行标注。针对该数据集进行的国际比赛已经进行了多届,暴露出了现有特征表示模型在处理连续自发式表情时的许多不足。连续自发式表情数据集视频量巨大、变化形式多样,且无峰值表情帧标注,因此,其特征表示的核心任务是表情帧的自动提取。在表情帧的自动提取方面,启发式的下采样(down sampling)方法获得了更好的性能,但这类方法需要有峰值表情帧标注的配合,不适用于无峰值表情帧标注的连续自发式表情识别。
发明内容
本发明提供了一种基于视觉注意理论的自适应下采样方法及装置,该方法把时域的表情信息量转换到频域上,通过频率分析来获得自适应下采样因子,因此更好的模拟了人类的注意力,采样获取的表情帧表情表征能力更强,用于解决现有技术不适用于无峰值表情帧标注的连续自发式表情识别的技术问题。
本发明提供一种基于视觉注意理论的自适应下采样方法,包括:
通过全局光流法度量视频片段的表情变化量;
通过离散余弦变换方法把视频片段的表情变化量转换到频域空间,获取频域上的表情信息量指标;
根据频域上的表情信息量指标确定视频片段的下采样因子。
优选地,所述通过全局光流法度量视频片段的表情变化量具体包括:
通过全局光流法中的全局光流公式计算视频片段中每一帧的时间特征f(n);
将视频片段的时间特征作为表情变化量,所述视频片段的时间特征为视频片段中每一帧的时间特征f(n)的集合;
优选地,所述全局光流公式为:
其中,ΔIn(x)表示关于像素向量x的In和In-1两帧之间的光流。2是二级范数。
优选地,所述通过离散余弦变换方法把视频片段的表情变化量转换到频域空间,获取频域上的表情信息量指标具体包括:
通过离散余弦变换方法把视频片段的时间特征转换到频域空间,获取频域上的表情信息量指标
优选地,所述通过离散余弦变换方法把视频片段的时间特征转换到频域空间,获取频域上的表情信息量指标之前还包括:
通过直流偏移量去除公式将视频片段的时间特征的直流偏移量去除;
所述直流偏移量去除公式为:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于广东工业大学,未经广东工业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810379089.5/2.html,转载请声明来源钻瓜专利网。