[发明专利]一种基于视频图像和语音的双模态融合情感识别方法在审

申请号：	202110650544.2	申请日：	2021-06-10
公开（公告）号：	CN113343860A	公开（公告）日：	2021-09-03
发明（设计）人：	李为相;王传昱;程明	申请（专利权）人：	南京工业大学
主分类号：	G06K9/00	分类号：	G06K9/00;G06K9/62;G06N3/04;G06N3/08;G10L25/30;G10L25/63
代理公司：	暂无信息	代理人：	暂无信息
地址：	211816 江***	国省代码：	江苏;32
权利要求书：	查看更多	说明书：	查看更多
摘要：	本发明公开了一种基于视频图像和语音的双模态融合情感识别方法；由摄像头、麦克风和情感识别单元组成，其中情感识别单元由视频图像模态和语音模态组成。双模态模型的训练过程为：将图像训练数据集输入到卷积神经网络模型中进行训练，得到视频图像模态模型；将语音训练数据集输入到长短期记忆神经网络模型中进行训练，得到语音模态模型。摄像头采集视频图像发送到情感识别单元，分析人脸表情特征得到识别结果；麦克风采集语音数据发送到情感识别单元，分析语音情感特征得到识别结果；在决策层依据权值准则融合两个模态的识别结果并输出。本发明采用的识别方法能够提高情感识别的准确率并实现实时检测。
搜索关键词：	一种基于视频图像语音双模融合情感识别方法
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【主权项】：

暂无信息

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于南京工业大学，未经南京工业大学许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/patent/202110650544.2/，转载请声明来源钻瓜专利网。

专利分类

免登录下载普通用户下载升级VIP会员，免费下载

专利文献下载