[发明专利]基于稀疏编码的唇语特征身份认证方法在审
| 申请号: | 201610012017.8 | 申请日: | 2016-01-08 |
| 公开(公告)号: | CN105787428A | 公开(公告)日: | 2016-07-20 |
| 发明(设计)人: | 王士林;赖骏尧;夏霙;李翔;裘瑛 | 申请(专利权)人: | 上海交通大学;上海数据分析与处理技术研究所 |
| 主分类号: | G06K9/00 | 分类号: | G06K9/00;G06F21/32 |
| 代理公司: | 上海汉声知识产权代理有限公司 31236 | 代理人: | 郭国中 |
| 地址: | 200240 *** | 国省代码: | 上海;31 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 基于 稀疏 编码 特征 身份 认证 方法 | ||
技术领域
本发明涉及信息安全技术领域,具体地,涉及一种基于稀疏编码的唇语特征身份 认证方法。
背景技术
在过去的若干年间,生物特征已经被广泛地应用于身份认证。一些较为成熟的生物 特征,例如指纹、瞳孔、人脸等,已经走出实验室,得到商业应用。一些近期的研究工 作表明,嘴唇区域的视觉信息及运动信息,能为讲话人的身份认证提供充足的信息。因 此其有望成为一种新的生物特征,被应用于身份认证。
与传统生物特征有所不同,唇语生物特征同时包含了生理结构与行为习惯的双重信 息,用以确定讲话人的身份。不同的人,其嘴唇区域的形状与纹理(嘴唇区域的灰度变 化)有所不同,是为唇语的生理结构信息。另一方面,说话时嘴唇区域的运动模式反映 了讲话人经年累月养成的习惯,是为唇语的行为习惯信息。两类信息相辅相成,有助于 提高身份认证的准确率,同时也能提高身份认证系统的鲁棒性及抗攻击能力。
将上述两类信息应用于身份认证领域,近年来国际上有一定影响力的研究成果有: Luettin等人使用主动形状模型(ASM)对上下嘴唇的形状与纹理进行建模,以描述嘴 唇的静态生理结构特征。Broun等人将讲话时显露的口腔内部区域的相关信息加入唇语 的生理结构特征。Wang等人使用独立成分分析技术,对上下嘴唇及口腔区域进行表示, 改进了传统使用主成分分析描述唇语生理结构特征。行为习惯特征,则采用对静态特征 的一阶导数的形式加以体现。
经对现有技术的文献检索发现,Goswami等人在2012年在IEEE信息取证与安全专 刊(EEETransactionsonInformationForensicsandSecurity,vol.7,issue2,pp.602-612,2012.)上 发表的“基于局部有向对比度模式直方图的时空唇语身份认证”(LocalOrdinalContrast PatternHistogramsforSpatiotemporal,Lip-BasedSpeakerAuthentication)。该文中采用局部 有向对比度模式算子对嘴唇纹理进行描述,实现了将生理结构信息与行为习惯信息结 合,达到了一定的正确率。其不足在于:1)唇语特征的提取准确性不足;2)缺乏有身 份鉴别力的唇语特征表达;3)缺乏适合唇语特征的身份认证机制。
发明内容
针对现有技术中的缺陷,本发明的目的是提供一种基于稀疏编码的唇语特征身份 认证方法。
根据本发明提供的基于稀疏编码的唇语特征身份认证方法,包括如下步骤:
步骤1:依据嘴唇位置,从输入视频中提取嘴唇图像块;
步骤2:建立稀疏编码特征字典群,并对嘴唇图像块进行重构,计算重构误差;
步骤3:根据重构误差对输入视频中讲话用户进行身份识别和认证。
优选地,所述步骤1包括:
步骤1.1:识别输入视频某一帧面部图片的嘴唇区域图像;
步骤1.2:以步骤1.1中的输入视频的该帧为起始帧,提取一段时间内输入视频所有 帧的嘴唇区域图像;
步骤1.3:将该段时间内提取的所有帧的嘴唇区域图像按照时间顺序进行堆叠获得 具有时空维度的嘴唇图像块。
优选地,所述步骤2包括:
步骤2.1:建立用户稀疏编码特征字典群;具体地,包括如下步骤:
步骤2.1.1:将训练集中所有用户讲述提示语的视频片段作为训练样本总体,并从每 一段视频片段中提取出具有相应用户特征的嘴唇图像块;
步骤i:将用户对应的所有嘴唇图像块作为输入信号,采用K-奇异值分解,即 K-SingularValueDecomposition,简称为K-SVD算法构建稀疏编码字典;所述稀疏编码 字典中包含若干用户独特的嘴唇图像块基础信号,能够作为与用户的特征字典;
步骤2.1.2:对训练集中每一个用户的嘴唇图像块执行步骤i,获得所有用户的特征 字典,所有用户的特征字典构成稀疏编码特征字典群;
步骤2.2:使用正交匹配追踪OrthogonalMatchingPursuit,简称为OMP算法,以给 定特征字典中的基础信号为基底,对待识别视频提取的嘴唇图像块进行变换;
步骤2.2.1:选取变换向量中特征值最大的S(一般取3或5或7)个元素,将其他 元素置为0,其中S称为稀疏编码的稀疏度;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海交通大学;上海数据分析与处理技术研究所,未经上海交通大学;上海数据分析与处理技术研究所许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201610012017.8/2.html,转载请声明来源钻瓜专利网。





