[发明专利]基于稀疏编码的唇语特征身份认证方法在审
申请号: | 201610012017.8 | 申请日: | 2016-01-08 |
公开(公告)号: | CN105787428A | 公开(公告)日: | 2016-07-20 |
发明(设计)人: | 王士林;赖骏尧;夏霙;李翔;裘瑛 | 申请(专利权)人: | 上海交通大学;上海数据分析与处理技术研究所 |
主分类号: | G06K9/00 | 分类号: | G06K9/00;G06F21/32 |
代理公司: | 上海汉声知识产权代理有限公司 31236 | 代理人: | 郭国中 |
地址: | 200240 *** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 稀疏 编码 特征 身份 认证 方法 | ||
1.一种基于稀疏编码的唇语特征身份认证方法,其特征在于,包括如下步骤:
步骤1:依据嘴唇位置,从输入视频中提取嘴唇图像块;
步骤2:建立稀疏编码特征字典群,并对嘴唇图像块进行重构,计算重构误差;
步骤3:根据重构误差对输入视频中讲话用户进行身份识别和认证。
2.根据权利要求1所述的基于稀疏编码的唇语特征身份认证方法,其特征在于, 所述步骤1包括:
步骤1.1:识别输入视频某一帧面部图片的嘴唇区域图像;
步骤1.2:以步骤1.1中的输入视频的该帧为起始帧,提取一段时间内输入视频所有 帧的嘴唇区域图像;
步骤1.3:将该段时间内提取的所有帧的嘴唇区域图像按照时间顺序进行堆叠获得 具有时空维度的嘴唇图像块。
3.根据权利要求1所述的基于稀疏编码的唇语特征身份认证方法,其特征在于, 所述步骤2包括:
步骤2.1:建立用户稀疏编码特征字典群;具体地,包括如下步骤:
步骤2.1.1:将训练集中所有用户讲述提示语的视频片段作为训练样本总体,并从每 一段视频片段中提取出具有相应用户特征的嘴唇图像块;
步骤i:将用户对应的所有嘴唇图像块作为输入信号,采用K-奇异值分解,即 K-SingularValueDecomposition,简称为K-SVD算法构建稀疏编码字典;所述稀疏编码 字典中包含若干用户独特的嘴唇图像块基础信号,能够作为与用户的特征字典;
步骤2.1.2:对训练集中每一个用户的嘴唇图像块执行步骤i,获得所有用户的特征 字典,所有用户的特征字典构成稀疏编码特征字典群;
步骤2.2:使用正交匹配追踪OrthogonalMatchingPursuit,简称为OMP算法,以给 定特征字典中的基础信号为基底,对待识别视频提取的嘴唇图像块进行变换;
步骤2.2.1:选取变换向量中特征值最大的S个元素,将其他元素置为0,其中S称 为稀疏编码的稀疏度;
步骤2.2.2:将部分置0后的变换向量进行逆变换,得到重构的嘴唇图像块;
步骤2.2.3:将重构的嘴唇图像块与初始嘴唇图像块进行比较,计算每一帧每一像素 点的差值的绝对值,并求和,得到重构误差。
4.根据权利要求3所述的基于稀疏编码的唇语特征身份认证方法,其特征在于, 所述步骤2.2.3中重构误差的计算公式如下:
式中:△表示重构误差,Mo(x,y,t)表示初始嘴唇图像块,Mr(x,y,t)表示重构后 的嘴唇图像块,其中嘴唇图像块中坐标(x,y,t)位置的取值为输入视频第t帧所提取的 嘴唇区域图像的行列坐标(x,y)位置的像素RGB值。
5.根据权利要求3所述的基于稀疏编码的唇语特征身份认证方法,其特征在于, 在步骤2中,使用用户稀疏编码特征字典群中的每一个特征字典,依次对嘴唇图像块进 行重构并计算重构误差;所述步骤3包括:
确定最小的重构误差所对应的特征字典,则讲话人被识别为该特征字典对应的用 户。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海交通大学;上海数据分析与处理技术研究所,未经上海交通大学;上海数据分析与处理技术研究所许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201610012017.8/1.html,转载请声明来源钻瓜专利网。