[发明专利]基于级联转换网络架构的情绪识别方法和系统在审

申请号：	201710801842.0	申请日：	2017-09-07
公开（公告）号：	CN107590457A	公开（公告）日：	2018-01-16
发明（设计）人：	简仁贤;杨闵淳;许世焕	申请（专利权）人：	竹间智能科技（上海）有限公司
主分类号：	G06K9/00	分类号：	G06K9/00;G06K9/62;G06N3/08;G06N3/04
代理公司：	北京酷爱智慧知识产权代理有限公司11514	代理人：	安娜
地址：	200120 上海市浦东新区自由贸***	国省代码：	上海;31
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	基于级联转换网络架构情绪识别方法系统
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【说明书】：

技术领域

本发明属于计算机机器学习技术领域，具体涉及一种基于级联转换网络架构的情绪识别方法和系统。

背景技术

随着深度学习技术的引入，图像辨识取得了大幅的进展，而此领域的核心技术便是卷积神经网络。传统的神经网络的架构由多层卷积堆叠而成(如图1)，而现行的顶尖网络单元模组为谷歌提出的Inception module，采用平行且多尺度的卷积层(如图2)，以及微软亚洲研究院所提出的残差神经网络，以增加捷径连结的方式，加快网络的训练的速度。

在现行的研究当中，有三个学派的研究是针对有效率与高效能的网络结构化设计：

1.讲求网络结构的深度(如Residual Networks,ResNet)，越深层的网络结构能提升识别的准确度。但在资料的有限性之下，网络一味的加深会造成网络模型参数大增与越慢的辨识速度，而准确度却无法呈现线性的提升。

2.讲求网络结构的广度(如Wider Residual Networks)，在架构上往每层多加几层不同类型的建构区块(即采用不同卷积层的连接方式)，让网络的广度增加而不需太深的网络，也可以达到相似的辨识效果。

3.针对每一层的建构区块结合(如Inception module或简单的卷积层等)以平行架构的分散式结构设计为主轴，在此架构下追求模型大小与效能下的最大优化，此架构可依照装置的需求限制来设计。本发明是建构在此类的模型设计原理与概念所开发的网络架构。

平行(Parallel)排列架构(如图2)，虽能同时进行多种特征转换，但由于输入来源相同，转换后的特征也会是在同一个特征等级上。而若采用堆叠式排列架构(如图1)，虽理想上可以得到更高层次的特征，但由于连续进行多个非线性转换，会造成训练收敛困难，延长训练时间，以及对参数初始值敏感等问题，因而采用堆叠式排列架构的模型，其人脸图像识别和情绪识别的速度和精度均不理想。

发明内容

针对以上问题的不足，本发明提供了一种基于级联转换网络架构的情绪识别方法和系统，本发明的级联转换架构在堆叠式排列架构的基础上做了一定的改进，加上捷径连结的方式，从而改善了现有模型的缺点，其情绪识别的结果在速度和精度上均获得更好的效果。

为实现上述目的，本发明提供的一种基于级联转换网络架构的情绪识别方法，包括：

获取图像信息；

将所述图像信息输入人脸检测模型，输出人脸图像信息；

将所述人脸图像信息输入情感识别模型，输出每种情感的概率值；

从所述每种情感的概率值中选择出最大概率值，输出所述最大概率值所对应的情感。

优先地，所述人脸检测模型和所述情感识别模型均采用级联转换网络架构。

优选地，所述级联转换网络架构包括输入层、隐含层和输出层，所述隐含层包括第一卷积层至第N卷积层的若干个卷积层，所述N为大于等于2的正整数，所述第一卷积层的输入值为输入层的初始输入值，其余卷积层的输入值为上一级卷积层的输出值，所述输出层的多个输入值分别为所述输入层的初始输入值和每个所述卷积层的输出值。

优先地，设所述输入层的初始输入值为x，所述输出层的输出值为Y，所述若干个卷积层的输出值分别为f(x)₁、f(x)₂……f(x)_N，则所述输出层的输出值Y＝x+f(x)₁+f(x)₂……f(x)_N。

基于级联转换网络架构的情绪识别系统，包括：

输入模块，用于获取图像信息；

人脸检测模块，用于将所述图像信息输入人脸检测模型，输出人脸图像信息；

情感识别模块，用于将所述人脸图像信息输入情感识别模型，输出每种情感的概率值；

输出模块，用于从所述每种情感的概率值中选择出最大概率值，输出所述最大概率值所对应的情感。

由上述方案可知，本发明的有益效果为：本发明的级联转换架构在堆叠式排列架构的基础上做了一定的改进，加上捷径连结的方式，从而改善了现有模型的缺点，其情绪识别的结果在速度和精度上均获得更好的效果。

附图说明

为了更清楚地说明本发明具体实施方式或现有技术中的技术方案，下面将对具体实施方式或现有技术描述中所需要使用的附图作简单地介绍。在所有附图中，类似的元件或部分一般由类似的附图标记标识。附图中，各元件或部分并不一定按照实际的比例绘制。

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于竹间智能科技（上海）有限公司，未经竹间智能科技（上海）有限公司许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/pat/books/201710801842.0/2.html，转载请声明来源钻瓜专利网。

上一篇：一种建筑用挤塑板自动打孔机及其加工方法
下一篇：一种车用内饰旋动压制剪断吊环带与拉手生产系统

同类专利

专利分类

G 物理

G06 计算；推算；计数
G06K 数据识别；数据表示；记录载体；记录载体的处理
G06K9-00 用于阅读或识别印刷或书写字符或者用于识别图形，例如，指纹的方法或装置
G06K9-03 .错误的检测或校正，例如，用重复扫描图形的方法
G06K9-18 .应用具有附加代码标记或含有代码标记的打印字符的，例如，由不同形状的各个笔画组成的，而且每个笔画表示不同的代码值的字符
G06K9-20 .图像捕获
G06K9-36 .图像预处理，即无须判定关于图像的同一性而进行的图像信息处理
G06K9-60 .图像捕获和多种预处理作用的组合

免登录下载普通用户下载升级VIP会员，免费下载

[发明专利]基于级联转换网络架构的情绪识别方法和系统在审

专利文献下载