[发明专利]一种适用于触控的视线交互方法在审

申请号：	201710093165.1	申请日：	2017-02-21
公开（公告）号：	CN106909220A	公开（公告）日：	2017-06-30
发明（设计）人：	孙建德;吴雪梅;李静;万文博;吴强	申请（专利权）人：	山东师范大学
主分类号：	G06F3/01	分类号：	G06F3/01;G06K9/00;G06T3/00
代理公司：	济南圣达知识产权代理有限公司37221	代理人：	李健康
地址：	250014 ***	国省代码：	山东;37
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	一种适用于视线交互方法
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【权利要求书】：

1.一种适用于触控的视线交互方法，其特征在于：将不同个体在不同外部条件下注视同一屏幕位置块的若干人眼图像归为一类，用卷积神经网络CNN实现模式分类，从而通过人眼图像识别其对应的屏幕注视位置块，该方法包括如下步骤：

(1)人眼数据库的建立：在不同光照、不同时间、不同位置条件下对多个个体注视屏幕上随机出现的注视点的过程进行数据采集，对采集的图像进行人脸检测和人眼检测，获得人眼区域图像，建立人眼数据库并对人眼图像进行筛选；

(2)将人眼图像分为训练集和验证集，作为卷积神经网络的输入，根据实际应用需求对电脑屏幕进行分块，注视屏幕上同一分块的人眼图像视为一类，对人眼图像进行分类，训练卷积神经网络；

(3)进行视线估计时，将待分类人眼图像输入到训练好的卷积神经网络模型中，即可判断其类别，并对应得到相应的屏幕注视位置块，从而对视线方向进行估计。

2.根据权利要求1所述的适用于触控的视线交互方法，其特征在于：上述步骤(1)的具体实现步骤为：

a、人眼图像采集，其具体步骤如下：

(a)考虑到实际应用，首先将计算机屏幕分为若干大块，每个大块内部继续分成若干个小块，每个小块中间设置注视点；

(b)实验者坐在屏幕前方摄像头范围内，眼睛跟随注视点移动，同时摄像机采集人脸图像，为了防止人眼疲劳，相邻两个注视点设置时间间隔，此时摄像头不采集图像；

(c)对采集的图像进行筛选，提取可用样本数据；

b、对人脸图像进行人脸检测和人眼检测，并将人眼矩形归一化到统一大小用于训练卷积神经网络。

3.根据权利要求1所述的适用于触控的视线交互方法，其特征在于：上述步骤(2)的具体实现步骤为：

a、数据选择方面，将可用样本按一定比例分为训练集和验证集分别用于卷积神经网络训练和分类准确性的验证；

b、根据实际数据大小设置卷积神经网络结构模型为：

(a)卷积神经网络的卷积层：网络通过卷积层提取图像的深度特征，根据特征图大小选择相应的卷积核并对图像进行边缘扩充，卷积层第i层第j个特征图在(x,y)位置处的值为：

$<mrow><msubsup><mi>f</mi><mrow><mi>i</mi><mi>j</mi></mrow><mrow><mi>x</mi><mi>y</mi></mrow></msubsup><mo>=</mo><mi>r</mi><mi>e</mi><mi>l</mi><mi>u</mi><mrow><mo>(</mo><msub><mi>b</mi><mrow><mi>i</mi><mi>j</mi></mrow></msub><mo>+</mo><munder><mo>Σ</mo><mi>n</mi></munder><munderover><mo>Σ</mo><mrow><mi>p</mi><mo>=</mo><mn>0</mn></mrow><mrow><msub><mi>p</mi><mi>i</mi></msub><mo>-</mo><mn>1</mn></mrow></munderover><munderover><mo>Σ</mo><mrow><mi>q</mi><mo>=</mo><mn>0</mn></mrow><mrow><msub><mi>q</mi><mi>i</mi></msub><mo>-</mo><mn>1</mn></mrow></munderover><msubsup><mi>w</mi><mrow><mi>i</mi><mi>j</mi><mi>n</mi></mrow><mrow><mi>p</mi><mi>q</mi></mrow></msubsup><msubsup><mi>f</mi><mrow><mo>(</mo><mi>i</mi><mo>-</mo><mn>1</mn><mo>)</mo><mi>n</mi></mrow><mrow><mo>(</mo><mi>x</mi><mo>+</mo><mi>p</mi><mo>)</mo><mo>(</mo><mi>y</mi><mo>+</mo><mi>q</mi><mo>)</mo></mrow></msubsup><mo>)</mo></mrow></mrow>$

其中，relu(·)为修正线性单元，其公式为：g(x)＝max(0,x)，b_ij是第i层第j个特征图的偏置，n指与当前特征图连接的上一层特征图的集合，p_i,q_i分别指第i层卷积核的长、宽，是与上层特征图连接的卷积核在(p,q)处的值；

(b)卷积神经网络的采样层：网络通过采样层对图像进行降维处理，采样层第i层第j个特征图表示为

f_ij＝f(β_ijdown(f_(i-1)j)+b_ij)

其中，β_ij和b_ij分别是第i层第j个特征图的乘子偏差和附加偏差，down(·)是降采样函数，采用最大池化，在下采样层的后面连接LRN层，LRN层模仿生物神经系统的侧抑制机制，对局部神经元的活动创建竞争机制，使得响应比较大的值相对更大，提高模型的泛化能力。

(c)卷积神经网络的输出层：网络通过内积层实现全连接，最后输出类别号。

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于山东师范大学，未经山东师范大学许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/pat/books/201710093165.1/1.html，转载请声明来源钻瓜专利网。

同类专利

专利分类

G 物理

G06 计算；推算；计数
G06F 电数字数据处理
G06F3-00 用于将所要处理的数据转变成为计算机能够处理的形式的输入装置；用于将数据从处理机传送到输出设备的输出装置，例如，接口装置
G06F3-01 .用于用户和计算机之间交互的输入装置或输入和输出组合装置
G06F3-05 .在规定的时间间隔上，利用模拟量取样的数字输入
G06F3-06 .来自记录载体的数字输入，或者到记录载体上去的数字输出
G06F3-09 .到打字机上去的数字输出
G06F3-12 .到打印装置上去的数字输出

免登录下载普通用户下载升级VIP会员，免费下载

[发明专利]一种适用于触控的视线交互方法在审

专利文献下载