[发明专利]一种基于图卷积神经网络的人脸情绪识别方法有效
| 申请号: | 202010091759.0 | 申请日: | 2020-02-14 |
| 公开(公告)号: | CN111339847B | 公开(公告)日: | 2023-04-14 |
| 发明(设计)人: | 曾翰新;李根;童同;罗鸣;高钦泉 | 申请(专利权)人: | 福建帝视信息科技有限公司 |
| 主分类号: | G06V40/16 | 分类号: | G06V40/16;G06V10/82;G06N3/042;G06N3/0464 |
| 代理公司: | 福州元创专利商标代理有限公司 35100 | 代理人: | 陈明鑫;蔡学俊 |
| 地址: | 350002 福建省福州市*** | 国省代码: | 福建;35 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 基于 图卷 神经网络 情绪 识别 方法 | ||
1.一种基于图卷积神经网络的人脸情绪识别方法,其特征在于,包括如下步骤:
步骤1、将训练的视频序列按10帧每秒的采样速度,连续抽取4帧图片,即网络输入一组图片Ii包含4帧,索引i∈{0,1,2,3};
步骤2、将通过步骤1所获得的一组图片Ii利用多任务卷积神经网络MTCNN人脸检测模型将图片Ii中的人脸分割生成人脸图片组Fi以及去除人脸的背景图片Bi,索引i∈{0,1,2,3};
步骤3、利用FasterR-CNN模型算法检测图片中存在的各种物体类别,将背景图像Bi从欧式结构转换成非欧式结构的拓扑图Vi,Vi={v1,v2,...,vt}包含36个节点,索引t∈{0,1,2,...,35}和i∈{0,1,2,3};
步骤4、利用步骤2中生成的人脸图片组Fi分别执行串联卷积层阶段、平均池化阶段和注意力机制阶段;最终,获得人脸图片的特征信息Xface;
步骤5、利用步骤3中生成的拓扑图Vi分别执行初始阶段、图卷积阶段和注意力机制阶段;最终,获得拓扑图的特征信息Ybackground;
步骤6、利用步骤4和步骤5中生成的Xface和Ybackground分别执行融合阶段和分类阶段,最终得到视频或者图片的分类结果Cls(Xface,Ybackground);
步骤7、选出步骤6分类概率输出中与视频或图片标注类别相对应的概率值;
步骤8、基于步骤7得出的分类概率值,不断更新并优化获得最优的卷积权值参数和偏置参数;
所述步骤4具体实现如下:
步骤4.1、串联卷积阶段:该阶段由5个卷积运行块组成,每个卷积运行块是由卷积运算、批量归一化、激活函数和池化运算得到,其计算公式是:
X1=max(σr(bn(W1*Fi+B1)),0),i∈{0,1,2,3} (1)
其中W1和B1分别是卷积权值参数和偏置参数,bn是批量归一化函数,σr是Relu激活函数;
步骤4.2、平均池化阶段:该阶段将X1特征信息在时空维度上取平均,其计算公式是:
X2=aver(X1) (2)
步骤4.3、注意力机制阶段:该阶段包括卷积运算、激活函数和卷积运算,其计算公式是:
其中W31和W32分别是第一层和第二层卷积权值参数,和分别是第一层和第二层偏置参数,Xface是从人脸图片提取出来的特征信息;
所述步骤5具体实现如下:
步骤5.1、初始阶段:将拓扑图Vi进行全连接运算得到其输出Y1,其计算公式是:
Y1=W1*Vi+B1,i∈{0,1,2,3} (4)
其中W1和B1分别是全连接层权值参数和偏置参数;
步骤5.2、图卷积阶段:该阶段由4个图卷积运算块组成,一个图卷积运算块包括4次卷积运算,一个残差运算,得到其输出Y2,其计算公式是:
Y2=Wr*(R*Y1*Wg)+Y1 (5)
R=(Wi*Y1(Vi)T*(Wj*Y1(Vj))),i∈{0,1,2,3},j∈{0,1,2,3}
其中Wi和Wj分别是相关系数卷积层的权重参数,Wr和Wg分别是图卷积残差运算和图卷积运算的权重参数;
步骤5.3、注意力机制阶段:该阶段包括卷积运算、激活函数和卷积运算,其计算公式是:
其中W31和W32分别是第一层和第二层卷积权值参数,和分别是第一层和第二层偏置参数,σr是Relu激活函数,Ybackground是从背景图片提取出来的特征信息;
所述步骤6具体实现如下:
步骤6.1、融合阶段:该阶段将步骤4和步骤5生成的Xface和Ybackground执行softmax逻辑回归运算再按通道维度连接,其计算公式是:
F1={Xface*λface,Ybackground*λbackground}{λface,λbackground}=softmax(Xface,Ybackground) (7)
步骤6.2、分类阶段:该阶段包括2次卷积运算、丢失函数、激活函数和分类函数,其计算公式是:
其中W21和W22分别是第一层和第二层卷积权值参数,和分别是第一层和第二层偏置参数,drop是丢失函数,Logsoftmax是最后的分类函数,σr是Relu激活函数;
所述步骤8中,若分类概率值没有达到预先设定的分类识别率,则继续进行反向传播,利用梯度下降优化算法更新卷积权值参数和偏置参数,再执行步骤4;若分类概率值已经获得预先设定的分类识别率时,则停止反向传播,并最终求得步骤4、5和6所获得的卷积权值参数和偏置参数。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于福建帝视信息科技有限公司,未经福建帝视信息科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010091759.0/1.html,转载请声明来源钻瓜专利网。
- 上一篇:快速无效组相联TLB的方法
- 下一篇:一种回收利用己内酰胺的方法





