[发明专利]基于视线追踪的身份认证方法及装置有效
申请号: | 201711185630.0 | 申请日: | 2017-11-23 |
公开(公告)号: | CN107977560B | 公开(公告)日: | 2021-04-13 |
发明(设计)人: | 伍前红;李娜;刘建伟 | 申请(专利权)人: | 北京航空航天大学 |
主分类号: | G06F21/32 | 分类号: | G06F21/32;G06F3/01 |
代理公司: | 北京清亦华知识产权代理事务所(普通合伙) 11201 | 代理人: | 张润 |
地址: | 100191*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 视线 追踪 身份 认证 方法 装置 | ||
1.一种基于视线追踪的身份认证方法,其特征在于,包括以下步骤:
采集包含目标用户的视频图像;
根据所述视频图像获取所述目标用户在空间中视线方向,并获取所述目标用户在交互屏幕上的注视点,进一步包括:对所述视频图像中包含人脸的区域进行分割,获取包含所述目标用户的脸部图像;对所述脸部图像进行处理,并通过视线追踪得到对应于所述视频图像当前时刻的所述视线方向;根据所述视线方向和所述目标用户与所述交互屏幕之间的相对空间位置,获取所述目标用户对应于所述视频图像当前时刻在所述交互屏幕上的注视点位;其中,所述对所述视频图像中包含人脸的区域进行分割,获取包含所述目标用户的脸部图像,具体包括:当使用单个摄像头获取包含用户的单幅视频图像,并对单幅视频图像进行分割得到的脸部图像存在至少两个人脸时,选取最靠近摄像头的人脸作为用户的脸部图像;当使用单个摄像头获取包含用户的多幅视频图像或者使用多个摄像头获取包含用户的不同角度的多幅视频图像,并对多幅视频图像进行分割得到的脸部图像存在至少两个人脸时,先将各幅脸部图像中的人脸依照是否为同一对象进行匹配,得到对应于每一人脸的多幅脸部图像,然后选取平均最靠近摄像头的人脸作为用户的脸部图像;对于使用3D头部模型算法的视线追踪技术,在使用视线追踪技术计算出对应于视频图像获取时刻的用户的视线方向还包括对脸部图像进行进一步的分割,从而可以得到包含用户眼睛区域的眼部图像,然后结合视频图像、脸部图像和眼部图像进行建模,计算出对应于视频图像获取时刻的用户的视线方向;对于使用机器学习算法的视线追踪技术,不需要计算出对应于视频图像获取时刻的用户的视线方向,直接建立起视频图像、脸部图像和眼部图像三者的任意组合与用户对应于视频图像获取时刻在交互屏幕上的注视点位置之间的映射关系;
根据所述目标用户在交互屏幕上的注视点得到注视点信息,并根据所述注视点信息提取身份认证口令,进一步包括:在所述交互屏幕上显示用于口令输入的交互界面,其中,所述交互界面包含可被选中的符号,每一符号占用所述交互界面中的任一区域;将所述注视点位置对应到所述交互界面上的符号,其中,当所述注视点位置落在所述交互界面上任一符号所占用的区域内,所述任一符号与所述注视点位置互相对应;当视线注视所述任一符号并且注视时间满足预设条件时,所述任一符号确定被选中;将所有被选中的符号组成符号串,并且将所述符号串作为所述身份认证口令;具体地,所述交互界面包括交互区域、未选中符号和已选中符号,交互区域中仅包含未选中符号和已选中符号,将已选中符号和未选中符号进行区分,以提示用户某一交互符号是否被成功选中,当用户使用视线注视交互区域上的某一交互符号的注视时间满足预设条件时,所述某一交互符号确认成功被选中,符号被选后不能再被重复选中,且用户成功选中的未选中符号在选中后变为已选中符号,以提示用户该身份认证口令的输入情况,直到达到输入终止条件;
判断所述身份认证口令与预设口令是否匹配;以及
如果所述身份认证口令与所述预设口令匹配,则发出正确提示,否则发出错误提示,并执行相应动作;
记录扫视过程中产生无效视线时对应的图像数目、扫视过程中产生有效视线时对应的图像数目,并且控制扫视过程所消耗的时间和每次进行符号输入所消耗的时间,以利用视线的统计信息来减少符号判断错误;具体地:步骤601,获取用户当前的视频图像;步骤602,使无效图像数目计数器的数值加1,其中,所述无效图像数目计数器用于记录用户扫视过程中产生无效视线时对应的图像数目;步骤603,检查无效图像数目计数器的数值是否达到无效图像数目阈值,若达到阈值,则执行步骤604,若未达到阈值,则仍返回步骤601,其中,无效图像数目阈值用于控制用户扫视过程所消耗的时间;步骤604,将无效图像数目计数器的数值清零;步骤605,获取用户当前的视频图像;步骤606,使用现有的视频追踪技术计算用户在交互屏幕上的注视点;步骤607,将注视点位置进行存储,并使有效图像数目计数器的数值加1,其中,所述有效图像数目计数器,用于记录用户扫视过程中产生有效视线时对应的图像数目,对有效视频图像使用视频追踪技术计算用户在交互屏幕上的注视点的处理,对无效视频图像不进行视频追踪技术来计算用户在交互屏幕上的注视点的处理;步骤608,检查有效图像数目计数器的数值是否达到有效图像数目阈值,若达到阈值,则执行步骤609,若未达到阈值,则仍返回步骤605,其中,有效图像数目阈值用于控制用户每次进行符号输入所消耗的时间;步骤609,统计存储的所有注视点位置所对应的符号出现的频数,计算每个符号的出现频率,并计算最大频率值;步骤610,检查最大频率值是否达到选中频率阈值,若达到阈值,则执行步骤611,若未达到阈值,则返回步骤605,其中,选中频率阈值利用用户视线的统计信息来减少符号判断错误;步骤611,将最大频率值对应的符号作为被用户选中的符号用于组成用于身份认证的口令,并将有效图像数目计数器清零,将存储的所有注视点位置删除;步骤612,输出符号判决结果。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京航空航天大学,未经北京航空航天大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201711185630.0/1.html,转载请声明来源钻瓜专利网。