[发明专利]一种可以供盲人使用的情绪识别眼镜在审

专利信息
申请号: 202111102015.5 申请日: 2021-09-18
公开(公告)号: CN113808623A 公开(公告)日: 2021-12-17
发明(设计)人: 肖纯;宋华 申请(专利权)人: 武汉轻工大学
主分类号: G10L25/63 分类号: G10L25/63;G10L25/90;G06K9/00;G09B21/00;G10L15/22
代理公司: 北京思创大成知识产权代理有限公司 11614 代理人: 高爽
地址: 430023 湖北省*** 国省代码: 湖北;42
权利要求书: 查看更多 说明书: 查看更多
摘要: 发明公开了一种可以供盲人使用的情绪识别眼镜,包括:眼镜,眼镜上设置有图像捕捉模块和微表情获取模块,图像捕捉模块和微表情获取模块分别能够采集人物面部表情和微表情,处理模块,处理模块与图像捕捉模块和微表情获取模块电连接,处理模块能够根据采集的人物面部表情和微表情识别出对应人物的情绪信息,情绪反馈模块,情绪反馈模块用于接收所述情绪信息,该可以供盲人使用的情绪识别眼镜通过表情与微表情识别分析,能够实时向视障用户反馈对方的情绪信息,及时、高效的帮忙视障者更好的独立社交。
搜索关键词: 一种 可以 盲人 使用 情绪 识别 眼镜
【主权项】:
暂无信息
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于武汉轻工大学,未经武汉轻工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/patent/202111102015.5/,转载请声明来源钻瓜专利网。

同类专利
  • 一种基于声音信号的教学者情绪实时检测方法-202310850527.2
  • 冯旻涛;任强;姚淼娟;周荃 - 湖州师范学院
  • 2023-07-12 - 2023-10-27 - G10L25/63
  • 本发明提供一种基于声音信号的教学者情绪实时检测方法,属于声音解析处理技术领域,具体包括:通过关键知识点的类型、授课时长以及授课语句的数量进行所述关键知识点的权值的确定,并结合关键知识点的初始情绪识别结果进行教学者的总体情绪识别结果的确认,并通过关键知识点时段的占比确认教学者的总体情绪识别结果的准确度不能满足要求时,通过教学者在一般时段的语音信号确定情感异常次数以及情感异常时间,并结合一般时段的授课时长进行教学者在一般时段的情绪识别结果的确认,并结合总体情绪识别结果进行教学者的情绪识别结果的输出,从而提升了教学者的情绪检测的全面性和准确性。
  • 一种基于深度学习的不定长音频情绪识别方法-202310757635.5
  • 池凯凯;缪明轩;苏立冬;高华 - 浙江工业大学
  • 2023-06-26 - 2023-10-27 - G10L25/63
  • 本发明设计属于语音识别领域,具体涉及到一种基于深度学习的不定长音频情绪识别方法。包括:识别待处理音频的时长为m秒,根据时长m对待处理音频进行情绪识别;当m30时,将待处理音频切分为m/3个3秒的待处理片段,将m/3个待处理片段输入第一模型,获得分类结果,选用出现次数最多的分类结果作为结果输出;当m30时,将待处理音频的前30秒切分为10个3秒的片段输入第二模型、时间‑情绪特征深度提取网络和分类器中,得到最终情绪识别结果。本发明解决了现实应用中音频不定长与训练时音频定长产生冲突的问题,充分利用情绪信息和时间信息,提高识别精度,模型拥有较小参数量,训练时间成本较低,可很好地应用在嵌入式设备中。
  • 一种基于语音情感的飞行员工作负荷实时评估方法-202310488480.X
  • 吴红兰;李瑞航;孙有朝 - 南京航空航天大学
  • 2023-05-04 - 2023-10-27 - G10L25/63
  • 本发明公开了一种基于语音情感的飞行员工作负荷实时评估方法,包括:采集飞行员语音数据,进行预处理和特征提取;分析音频表征情感类别,并归一化处理获取分类概率;通过情感混淆矩阵建立决策粗糙集,计算接受和拒绝每类情感的阈值,将分类概率与阈值进行对比,做出接受、待定、拒绝识别结果的决策;以PAD情感空间理论建立三维坐标系,通过决策结果调整飞行员情感状态坐标;根据调整后的飞行员情感状态坐标与基准情感的欧式距离得到情感评估值,结合基准情感的工作负荷权重计算飞行员工作负荷实时评估值。本发明具有实时性、无需佩戴测量设备等优点,能够提升对飞行员工作状态的认知,有助于及时有效地辅助飞行员心理状态调适,保障飞行的安全性。
  • 音乐添加方法、装置、计算机设备及计算机可读存储介质-202310702409.7
  • 彭子娇;张伟彬;陈东鹏 - 深圳市声扬科技有限公司
  • 2023-06-13 - 2023-10-27 - G10L25/63
  • 本申请实施例公开了一种音乐添加方法、装置、计算机设备及计算机可读存储介质,该方法包括:获取虚拟场景中的对话音频片段;确定对话音频片段的情绪类型;将对话音频片段转换为文字文本,得到对话文本内容;计算第一关键词与情绪类型对应关键词表中每个关键词之间的相似度得到多个相似度得分,该第一关键词为所述对话文本内容中的任一关键词;在多个相似度得分中存在相似度得分大于或等于预设相似度阈值的情况下,识别第一关键词的情绪意图;获取情绪意图对应的背景音乐;在对话音频片段中添加背景音乐。通过自动选择相应的背景音乐添加到虚拟场景的对话音频片段中,提高了在虚拟场景的对话片段中添加背景音乐的自动化。
  • 语音情感变化识别方法、装置、电子设备及介质-202211445178.8
  • 林炳怀;王丽园 - 腾讯科技(深圳)有限公司
  • 2022-11-18 - 2023-10-27 - G10L25/63
  • 本公开提供了一种语音情感变化识别方法,包括:获取第一语音片段和第二语音片段,所述第一语音片段和第二语音片段来自于同一语音段,且所述第一语音片段在所述第二语音片段之前;将所述第一语音片段输入第一模型,生成第一向量,并将所述第二语音片段输入第二模型,生成第二向量,其中,所述第一模型和第二模型具有同样的结构和参数;将所述第一向量和所述第二向量输入分类器,由所述分类器对所述第一语音片段到所述第二语音片段的情感变化进行分类。本公开实施例能高效地识别出语音情感的变化。本公开实施例可应用于云技术、人工智能、智慧交通、辅助驾驶等各种场景。
  • 一种语音情感识别方法和装置-202210378453.2
  • 赵东明;王敏辉;陈萍 - 中国移动通信集团天津有限公司;中国移动通信集团有限公司
  • 2022-04-06 - 2023-10-24 - G10L25/63
  • 本发明公开了一种语音情感识别方法和装置,用以解决语音情感识别不准确的问题。本方案包括:获取待识别的语音音频和基于语音音频识别得到的语音文本;对语音音频和语音文本分别执行特征提取,以获取音频特征序列和文本特征序列;根据双向长短期记忆网络模型对音频特征序列和文本特征序列分别执行特征编码,以获取音频特征编码结果和文本特征编码结果;对音频特征编码结果和文本特征编码结果基于隐藏状态执行特征对齐,以获取特征对齐后的融合特征序列;基于支持向量机对融合特征序列执行分类,以确定语音音频的情感识别结果。本方案采用支持向量机执行情感分类,实现网络结构优化,能高效识别两极情绪,提升情感识别准确性。
  • 一种情绪识别方法及系统-202310981296.9
  • 周丽萍;吕召彪;赵文博 - 联通(广东)产业互联网有限公司
  • 2023-08-04 - 2023-10-24 - G10L25/63
  • 本发明提供一种情绪识别方法及系统,包括获取语音音频文件,包括一类数据和二类数据;利用XGBoost算法对一类数据进行分析处理,得到预测向量;对二类数据进行频谱转换和文本转换,得到音频特征向量和文本特征向量;利用融合网络对预测向量、音频特征向量和文本特征向量进行融合处理,得到情绪识别结果。通过对语音音频文件进行不同处理得到预测向量、音频特征向量和文本特征向量,并对三者进行融合处理,不仅提高了语音文本识别的准确度,还考虑了语音中情绪语气不同导致的声音波动,进而提高了情绪识别的准确度,此外由于各部分处理是单独同时进行的,因此保证了情绪识别的效率,解决了如何实现高准确度和高识别效率的语音情绪识别的问题。
  • 客户音频数据的处理方法、装置和服务器-202310936280.6
  • 娄潇;商晓冉;赵彤彤;郭蒙 - 中国工商银行股份有限公司
  • 2023-07-27 - 2023-10-24 - G10L25/63
  • 本说明书提供了客户音频数据的处理方法、装置和服务器,可用于人工智能领域。基于该方法,在得到包含有目标客户的语音记录的目标音频数据后,先根据预设的拆分规则,将该目标音频数据拆分成多个音频片段;再提取得到音频片段的语音情绪特征;并根据音频片段的语音情绪特征,构建得到针对目标音频数据的语音情绪特征曲线;同时将音频片段转换为对应的文本片段;提取得到文本片段的文字情绪特征;并根据文本片段的文字情绪特征,构建得到针对目标音频数据的文字情绪特征曲线;再组合语音情绪特征曲线和文字情绪特征曲线,得到联合情绪特征曲线;根据联合情绪特征曲线,能够在目标语音客服服务过程中精准地确定出导致目标客户不满意的异常节点。
  • 语音情绪分析方法、装置、设备及计算机程序产品-202310883709.X
  • 王博;李欣然;孙伟;侯普;吕程程 - 中国移动通信集团北京有限公司;中国移动通信集团有限公司
  • 2023-07-18 - 2023-10-20 - G10L25/63
  • 本申请涉及语音识别领域,提供一种语音情绪分析方法、装置、设备及计算机程序产品,所述语音情绪分析方法包括:对目标音频样本进行特征提取,得到语音情感特征和文本情感特征,目标音频样本是对原始音频样本进行预处理得到的;对语音情感特征和文本情感特征进行分帧对齐和样本标注,得到初始音频样本;基于初始音频样本中的各分帧节点,确定初始音频样本的聚类特征值,将各初始音频样本的聚类特征值分布区域和预设情感分布图结合得到特征聚类结果值分布图;根据待分析音频的聚类特征值与特征聚类结果值分布图,确定待分析音频的情绪分析结果。本申请通过多维度情绪特征值提取融合聚类算法分析用户情绪,提高了用户情绪识别的准确性。
  • 一种语音情绪识别方法、装置及电子设备-202110929972.9
  • 陈蓉 - 北京百度网讯科技有限公司
  • 2021-08-13 - 2023-10-20 - G10L25/63
  • 本公开提供了一种语音情绪识别方法、装置及电子设备,包括:获取目标对象的原始语音特征;获取原始语音特征的原始区域,其中,原始区域用于表征原始语音特征在原始粒度中的情绪信息;对原始区域中包括的至少两个单元进行合并处理,基于处理结果得到目标区域,并基于原始区域和目标区域对原始语音特征进行处理,得到目标语音特征,其中,目标区域用于表征原始语音特征在目标粒度中的情绪信息,目标粒度大于原始粒度;对目标语音特征进行识别,得到与目标语音特征匹配的语音情绪结果。本公开解决了相关技术中识别语音中情绪的准确率较低的技术问题。
  • 基于音频情感的辅助审判方法、装置、设备及存储介质-202311013453.3
  • 王敏 - 北京分音塔科技有限公司
  • 2023-08-14 - 2023-10-20 - G10L25/63
  • 本发明涉及音频检测领域,公开了一种基于音频情感的辅助审判方法、装置、设备及存储介质。该方法包括:获取线上法庭中待审判案件的庭审音频数据和庭审辅助信息,并按照待审判案件中各方审判人员,对庭审音频数据进行音频分类;提取分类结果中各方审判人员的多种频谱特征,并计算出各频谱特征对应的庭审情感值;利用预设庭审情感模型匹配各庭审情感值对应的情感特征,生成各方审判人员对应庭审音频片段的庭审情感标签;基于庭审情感标签,检测庭审辅助信息中对应审判人员的辩护真实性,得到检测结果,并基于检测结果和庭审辅助信息,生成待审判案件的辅助审判结果。本申请提高了线上庭审案件中基于音频情感状态分析的辅助审判结果的准确率。
  • 情感推定装置-201911042032.7
  • 大熊显至;冈田隆;齐藤航太;崔胜镐;松尾祥和;菊地直规;池信克也 - 本田技研工业株式会社
  • 2019-10-30 - 2023-10-17 - G10L25/63
  • 本发明提供一种情感推定装置。情感推定装置(10)具有存储部(16)、事件预测部(22)和频率设定部(26),其中,存储部(16)存储引起人的情感变化的一个以上的事件和用于按每个事件来预测事件的发生的预测信息(32);事件预测部(22)根据对预测信息(32)进行检测的情况来预测事件的发生;频率设定部(26)设定进行情感推定的频率,在由事件预测部(22)预测事件的发生的情况下,频率设定部(26)设定比没有预测事件的发生的情况高的频率,并且根据事件的内容来设定频率。根据本发明,能够恰当地掌握人的情感,并且能够抑制运算负荷增大。
  • 语音情感识别方法、装置、计算机设备及存储介质-202310727633.1
  • 张旭龙;王健宗;程宁;孙一夫 - 平安科技(深圳)有限公司
  • 2023-06-16 - 2023-10-13 - G10L25/63
  • 本发明涉及数字医疗领域,公开了一种语音情感识别方法、装置、计算机设备及存储介质,所述方法包括:筛选出训练样本中的干净标签样本;将所述干净标签样本输入到第一语音情感识别模型,以对所述第一语音情感识别模型中的特征提取器进行训练;将验证样本输入到训练后的所述第一语音情感识别模型,以验证所述特征提取器是否得到充分训练;如果所述特征提取器得到充分训练,将目标语句分段输入到第二语音情感识别模型,得到目标语句的情感预测结果;所述第一语音情感识别模型和所述第二语音情感识别模型共享所述特征提取器。本发明通过对特征提取器进行训练,以对目标语句进行针对性特征提取,进而提高对医疗领域中病人语句的情感识别精度。
  • 一种基于能量帧时频融合的语音情感识别方法-202310080993.7
  • 章昭辉;王鹏伟;张家豪;严琦 - 东华大学
  • 2023-01-30 - 2023-10-10 - G10L25/63
  • 情感具有主观性与模糊性,而且语音在情感定义上缺乏官方标准。不同听者对同一段语音的情感可能有不同的观点。此外,不同人对同一情感的表达节奏和反应程度是不同的,而且同一个人在不同时刻对同一场景下的情感反应也有可能不同。为了解决该问题,本发明公开的一种基于能量帧时频融合的语音情感识别方法主要由两部分构成:第一部分通过计算语音帧的能量,选出能量大的语音帧转为频谱图作为输入;第二部分语音在时序上和频域上均有情感特征,采取CNN+RNN的网络结构分别对频域和时域进行特征提取,从而能够保证一定的准确率。本发明公开的方法成功体现出了个体间语音节奏的差异,具体是在能量上的分布差异,从而能够更准确地识别出语音情感。
  • 基于人工智能的语音情感识别方法、装置、设备及介质-202310573340.2
  • 张旭龙;王健宗;程宁;赵嘉豪 - 平安科技(深圳)有限公司
  • 2023-05-19 - 2023-10-03 - G10L25/63
  • 本发明适用于金融科技领域,尤其涉及一种基于人工智能的语音情感识别方法、装置、设备及介质。本发明实施例得到待识别文本的文本向量并输入至多尺度注意力模型得到文本输出特征,得到待识别音频的音频频谱并输入至多尺度注意力模型得到音频输出特征,将文本输出特征和音频输出特征融合后,基于全连接层得到语音情感识别结果,通过对文本向量和梅尔频谱进行N次不同尺度的卷积,获得了更丰富的文本特征信息和音频特征信息,并根据注意力机制子模型对不同尺度的卷积结果进行注意力权重计算以及融合,提高了对语音情感信息的表征能力,提高了语音情感识别结果的准确性,在金融领域中提高了解决客户疑问、指导客户交易、提供售后服务的效率和质量。
  • 语音标签样本生成方法、装置、设备和存储介质-202310632820.1
  • 张旭龙;王健宗;程宁;孙一夫 - 平安科技(深圳)有限公司
  • 2023-05-31 - 2023-10-03 - G10L25/63
  • 本发明实施例提供语音标签样本生成方法、装置、设备和存储介质,涉及人工智能及数字医疗技术领域。该方法包括:对音频样本进行分段得到多个分段音频,再利用标签修正子模型得到每个分段音频与参考音频的标签相似度,基于标签相似度从参考音频的参考标签中选取得到每个分段音频的修正标签,结合分段音频的预测标签调整损失值,直至得到参数合适的语音标签标注模型。本申请实施例得到的语音标签标注模型对每个分段音频样本生成合适的参考标签,有效降低音频样本标注的难度和成本,并且分段音频样本的标签标注准确性更高,有效提升包含标签的语音样本的生成数量和质量。
  • 一种语音情感识别方法、系统、电子设备及介质-202310934363.1
  • 刘文;李玺坤;王冬霞;朱立谷;石磊;张伟;汤新坤;徐颖 - 中国传媒大学
  • 2023-07-27 - 2023-09-29 - G10L25/63
  • 本发明公开一种语音情感识别方法、系统、电子设备及介质,涉及视听内容情感识别领域,方法包括:获取待识别语音信号;利用语音情感识别模型,对待识别语音信号进行识别,预测情感种类;其中,语音情感识别模型是利用训练数据集对语音情感识别初始模型进行训练得到的;训练数据集包括多条已标注地理标签和情感种类标签的方言语音信号;语音情感识别初始模型包括依次连接的中文语音预训练模型chinese‑hubert‑base、第一全连接层以及第二全连接层;所述情感种类为愤怒、期待、厌恶、恐惧、喜悦、悲伤、惊喜或信任。本发明提高了语音情感识别的准确性。
  • 一种基于语音数据的情绪识别方法、终端设备及介质-201910602469.5
  • 方豪;占小杰;王少军 - 平安科技(深圳)有限公司
  • 2019-07-05 - 2023-09-29 - G10L25/63
  • 本发明适用于人工智能技术领域,提供了一种基于语音数据的情绪识别方法、终端设备及介质,包括:对各条原始音频数据进行音转文处理,得到各条原始音频数据各自对应的文本数据;采用预设正则表达式从所有文本数据中确定目标文本数据;确定各条目标文本数据的第一特征向量;将各条目标文本数据的第一特征向量导入预先训练的情绪识别模型,得到各条目标文本数据的类别置信度向量;情绪识别模型通过情绪类别为目标情绪类别的文本数据训练得到;将类别置信度向量中值最大的元素对应的预设情绪类别确定为目标文本数据所属的情绪类别,从而提高了情绪识别模型对目标情绪类别识别的准确率。
  • 一种语音情感识别方法、装置、电子设备及存储介质-202310936510.9
  • 叶俊杰;李权;王伦基;莫世玉;付玫;成秋喜 - 广州赛灵力科技有限公司
  • 2023-07-27 - 2023-09-22 - G10L25/63
  • 本发明公开了语音情感识别方法、装置、电子设备及存储介质,方法包括:获取待识别的语音数据,对语音数据进行标准化处理,获得语音波形数据;利用语音情感识别模型,对语音波形数据进行分析处理,获得情感识别结果;语音情感识别模型通过已标注情感离散分类的第一语音波形数据、已标注情感连续向量的第二语音波形数据以及已标注情感离散分类和情感连续向量的第三语音波形数据混合训练生成。本发明实施例通过标注情感离散分类和标注情感连续向量各种组合的多种语音波形数据的混合训练,在情感分类的语音数据基础上再利用连续变量定义情感维度的数据,充分挖掘数据隐藏特征,能够准确进行语音情感识别,可广泛应用于音频处理技术领域。
  • 语音情感识别方法、装置、设备及存储介质-202110748319.2
  • 张旭龙;王健宗 - 平安科技(深圳)有限公司
  • 2021-06-30 - 2023-09-22 - G10L25/63
  • 本发明涉及人工智能,提供一种语音情感识别方法、装置、设备及存储介质。该方法能够获取预设学习器,基于样本音频及标注结果调整预设学习器的网络参数,直至调整后的预设学习器收敛,得到情感识别模型,基于预先训练好的降噪模型对用户语音进行降噪处理,得到目标语音,对目标语音进行预处理,得到梅谱信息,将梅谱信息输入至情感识别模型中,得到语音输出向量,根据语音输出向量及预设结果映射表生成语音情感。本发明能够准确的识别出所述语音情感。此外,本发明还涉及区块链技术,所述语音情感可存储于区块链中。
  • 用户智能分类方法、服务器及存储介质-201910525920.8
  • 叶梦君 - 平安银行股份有限公司
  • 2019-06-18 - 2023-09-22 - G10L25/63
  • 本发明公开了一种用户智能分类方法,应用于服务器,该方法包括从数据库中获取用户信息,根据用户信息提取出每个用户的特征信息,根据特征信息为每个用户分配一个或多个特征标签。同时,服务器对不同的特征标签数值化处理得到对应的数值后,利用预先确定的公式对得到的数值进行计算得出对应用户的评分分值,并利用预先确定的划分规则将评分分值对应的用户进行等级分类。利用本发明可以综合考虑每个用户的不同特征信息带来的影响,并通过对特征信息对应的特征标签数值化计算得出一个综合的评分分值,根据评分分值对每个用户进行等级分类,从而能够更精准地对不同等级的用户提供合理服务。
  • 一种基于多级特征联合学习的情感说话人识别系统-202310808911.6
  • 李冬冬;王喆;曾中良;杨海 - 华东理工大学
  • 2023-07-03 - 2023-09-19 - G10L25/63
  • 一种基于多级特征联合学习的情感说话人识别系统,包括如下步骤:首先,使用初始特征提取器提取语音片段的初始特征片段。接下来,构建由片段级特征增强网络和帧级特征增强网络构成多级特征联合学习框架,对特征片段在片段级别和帧级别进行增强。最后,使用增强后的特征片段作为说话人的表征方式对情感说话人进行识别。由于说话人在语音片段上存在说话人信息和情感信息,本发明利用多级特征联合学习方式来综合学习说话人的说话人信息和情感信息,从而加强语音信号的生理表征,进一步提高情感说话人识别系统的正确识别率。
  • 基于预训练模型的多模态情感识别方法及装置-202311083710.0
  • 陶建华 - 清华大学
  • 2023-08-28 - 2023-09-19 - G10L25/63
  • 本公开涉及一种基于预训练模型的多模态情感识别方法及装置,所述方法包括:将待识别音频的语音数据和文本数据分别输入语音编码器和文本编码器,将语音编码器的输出输入语音情感特征提取模块,并将语音情感特征输入语音跨模态情感特征提取模块;将文本编码器的输出输入文本情感特征提取模块,并将文本情感特征输入文本跨模态情感特征提取模块;将语音情感特征提取模块、文本情感特征提取模块、语音跨模态情感特征提取模块和文本跨模态情感特征提取模块的输出,输入预先训练好的情感分类模块中,得到待识别音频的情感类别,编码器和多个模块的联合使用,能够提高情感识别准确率。
  • 语音情感修改-201710036873.1
  • J.E.纳曼;S.马蒂;D.迪森索 - 哈曼国际工业有限公司
  • 2017-01-18 - 2023-09-19 - G10L25/63
  • 一种用于修改语音情感的技术。所述技术包括:确定与人相关联的情绪状态;以及基于所述情绪状态,修改从所述人获取的语音样本的一个或多个声学特性,以便更改与所述语音样本相关联的情感。所述技术还包括:基于已修改的所述一个或多个声学特性,生成第二语音样本;以及传输所述第二语音样本。
  • 情绪识别方法和装置、电子设备及存储介质-202310638282.7
  • 张旭龙;王健宗;程宁;朱可欣 - 平安科技(深圳)有限公司
  • 2023-05-31 - 2023-09-15 - G10L25/63
  • 本申请实施例提供了一种情绪识别方法和装置、电子设备及存储介质,属于金融科技技术领域。该方法包括:获取目标语音信号;对目标语音信号进行预处理,得到语义信息特征向量;对语义信息特征向量进行池化,得到降维特征向量;将降维特征向量按照目标任务的语义层次从低至高依次输入至多个级联的任务分类器,得到多个任务分类器各自输出的分类预测结果;基于多个目标任务对应的分类预测结果识别目标语音信号的情绪信息。基于此,本申请采用的任务分类器是按照任务的语义层次从低至高依次级联在一起,能够基于多个不同语义层次的分类预测结果识别语音信号的情绪信息,从而能够从语音信号中有效地提取高层语义,使得语音情绪识别更加准确。
  • 一种基于多任务学习的语音情感识别方法及系统-202310954870.1
  • 王志锋;陈增照;刘川;王胜明;王政;龚斌;石雅文;侯戈;冯子祚;林梦婷 - 华中师范大学
  • 2023-07-31 - 2023-09-12 - G10L25/63
  • 本发明提供一种基于多任务学习的语音情感识别方法及系统,属于情感识别领域,方法包括:获取预先训练好的多任务模型;多任务模型包括:预训练模型和多个任务分支,预训练模型用于提取语音的音频特征,多个任务分支包括:主任务和两个辅助任务,主任务进行语音情感识别,第一个辅助任务进行文本识别,第二个辅助任务进行说话人识别,多个任务分支训练阶段所用的损失函数将主任务和两个辅助任务各自的损失函数线性组合得到;将原始语音输入到多任务模型,获得识别的语音情感。本发明构建了以语音情感识别为主任务,文本识别和说话人识别为辅助任务的多任务学习框架,在多任务框架中训练时能够相互促进,提高了识别精度。
专利分类
×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

400-8765-105周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top