[发明专利]基于U-Net和LS-CNN的人脸表情识别方法有效
申请号: | 201910735015.5 | 申请日: | 2019-08-09 |
公开(公告)号: | CN110532900B | 公开(公告)日: | 2021-07-27 |
发明(设计)人: | 毛莎莎;石光辉;缑水平;焦昶哲;焦李成;路凯;李阳阳 | 申请(专利权)人: | 西安电子科技大学 |
主分类号: | G06K9/00 | 分类号: | G06K9/00;G06N3/04;G06N3/08 |
代理公司: | 陕西电子工业专利中心 61205 | 代理人: | 陈宏社;王品华 |
地址: | 710071 陕*** | 国省代码: | 陕西;61 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明提出了一种基于U‑Net和LS‑CNN的人脸表情识别方法,主要用于解决现有技术中存在的因人脸表情图像的全局信息不完整而导致人脸表情识别准确率较低的技术问题,实现步骤为:获取训练样本集C和待检测样本集V;构建基于深度卷积神经网络U‑Net和局部监督卷积神经网络LS‑CNN的人脸表情识别模型;对人脸表情识别模型进行迭代训练;基于训练好的人脸表情识别模型获取人脸表情识别结果。本发明通过U‑Net和LS‑CNN检测人脸表情图像中被遮挡或缺失的区域并降低该区域提取的特征的置信度,从而减小全局信息不完整对人脸表情识别的影响,能有效提高人脸表情识别的准确率,可用于人机交互、智慧教育、病人监护等领域。 | ||
搜索关键词: | 基于 net ls cnn 表情 识别 方法 | ||
【主权项】:
1.一种基于U-Net和LS-CNN的人脸表情识别方法,其特征在于,包括以下骤:/n(1)获取训练样本集C和待检测样本集V:/n(1a)对从人脸表情数据库中随机选取的t幅人脸表情图像分别进行采样,并对采样得到的分辨率相同的t幅人脸表情图像进行归一化,然后对归一化后的t幅人脸表情图像的表情类别进行标注,再将归一化后的t幅人脸表情图像以及每幅归一化后的人脸表情图像对应的标签作为训练样本集C,其中,训练样本集C中标签的类别数为q,t≥3000,q≥3;/n(1b)对e幅待检测的人脸表情图像{s1,s2,…,sj,…,se}分别进行采样,得到与训练样本集C中t幅人脸表情图像分辨率相同的e幅待检测人脸表情图像,并对采样后的e幅待检测人脸表情图像进行归一化,然后将归一化结果作为待检测样本集V,其中,sj为第j幅待检测的人脸表情图像,e≥4;/n(2)构建基于深度卷积神经网络U-Net和局部监督卷积神经网络LS-CNN的人脸表情识别模型:/n(2a)构建包括n个简单卷积神经网络{T1,T2,…,Ti,…,Tn}和n个权重卷积神经网络{P1,P2,…,Pi,…,Pn}的局部监督卷积神经网络LS-CNN,其中,第i个简单卷积神经网络Ti包括输入层、多个卷积层、多个池化层、展平层;第i个权重卷积神经网络Pi包括输入层、多个卷积层、多个全连接层、归一化层,归一化层采用Sigmoid函数进行归一化;Ti的最后一个池化层与Pi的输入层连接,Ti的展平层与Pi的归一化层连接,n≥4;/n(2b)删除深度卷积神经网络U-Net反卷积路径中的输出层,并将LS-CNN中的n个简单卷积神经网络{T1,T2,…,Ti,…,Tn}的输入层与删除反卷积路径输出层的U-Net的最后一层并行连接,然后将{T1,T2,…,Ti,…,Tn}的n个展平层相加,得到向量层,在向量层后连接多个全连接层,得到基于深度卷积神经网络U-Net和局部监督卷积神经网络LS-CNN的人脸表情识别模型;/n(3)对人脸表情识别模型进行迭代训练:/n(3a)设置训练迭代次数为X,训练总迭代次数为Z,并令X=1,Z≥20000;/n(3b)对人脸表情识别模型的权值进行初始化;/n(3c)将训练样本集C中的随机选取的m幅归一化后的人脸表情图像{g1,g2,…,gk,…,gm}及其对应的m个标签{l1,l2,…,lk,…,lm}作为人脸表情识别模型的输入,得到人脸表情识别模型中最后一个全连接层输出的m个概率向量{r1,r2,…,rk,…,rm},并计算第k个概率向量rk与第k个标签lk的交叉熵损失ok,然后求取m个交叉熵损失{o1,o2,…,ok,…,om}的均值交叉熵损失O,其中,m≥4,rk的维度大小与C中标签的类别数q相等;/n(3d)通过均值交叉熵损失O,对人脸表情识别模型的权值进行更新;/n(3e)判断X=Z是否成立,若是,得到训练好的人脸表情识别模型,否则,令X=X+1,并执行步骤(3c);/n(4)基于训练好的人脸表情识别模型获取人脸表情识别结果:/n将待检测样本集V中的e幅人脸表情图像{s1,s2,…,sj,…,se}作为训练好的人脸表情识别模型的输入,得到训练好的人脸表情识别模型中最后一个全连接层输出的e个概率向量{b1,b2,…,bj,…,be},并选择第j个概率向量bj中最大概率值对应的表情类别作为待检测样本集V中的人脸表情图像sj的表情识别结果hj,得到待检测样本集V中的e幅人脸表情图像的表情识别结果{h1,h2,…,hj,…,he}。/n
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于西安电子科技大学,未经西安电子科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201910735015.5/,转载请声明来源钻瓜专利网。