[发明专利]智慧楼宇人员语音表情多模态情感识别方法及系统在审
| 申请号: | 202210900503.9 | 申请日: | 2022-07-28 |
| 公开(公告)号: | CN115273905A | 公开(公告)日: | 2022-11-01 |
| 发明(设计)人: | 焦爽;陈光辉;杨亚飞;袁世通;李现伟;李帅飞;王宇轩;张明明;张璜;马仁婷 | 申请(专利权)人: | 中国大唐集团科学技术研究院有限公司中南电力试验研究院 |
| 主分类号: | G10L25/63 | 分类号: | G10L25/63;G10L25/24;G10L25/18;G06V40/16;G06V20/40;G06V10/82;G06V10/80;G06V10/774;G06V10/764;G06V10/74;G06N3/04 |
| 代理公司: | 北京思创大成知识产权代理有限公司 11614 | 代理人: | 张立君 |
| 地址: | 450003 河南省郑州市河南自贸试验*** | 国省代码: | 河南;41 |
| 权利要求书: | 暂无信息 | 说明书: | 暂无信息 |
| 摘要: | 本发明公开了一种智慧楼宇人员语音表情多模态情感识别方法及系统,方法包括:对采集的人员语音信息及表情视频进行预处理,包括:提取语音信息的MFCC特征,将表情视频分帧并提取表情图像中的表情区域;将MFCC特征输入至残差网络模型提取语音信息的高阶情感特征;将分帧的表情图像及提取的表情区域输入至3D‑CNN模型提取表情图像的高阶情感特征;利用MLP模型对语音信息和表情图像的高阶情感特征进行多模态融合,以识别出人员的情感状态,在融合过程中利用预先设计的损失函数完成语音表情图像多模态特征融合的端到端训练,并增大语音信息和表情图像的高阶情感特征之间的差异性。本发明能够提高语音表情图像多模态情感识别的识别率。 | ||
| 搜索关键词: | 智慧 楼宇 人员 语音 表情 多模态 情感 识别 方法 系统 | ||
【主权项】:
暂无信息
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国大唐集团科学技术研究院有限公司中南电力试验研究院,未经中国大唐集团科学技术研究院有限公司中南电力试验研究院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/202210900503.9/,转载请声明来源钻瓜专利网。





