[发明专利]一种追踪目标人的语义识别装置及识别方法有效
申请号: | 201711126940.5 | 申请日: | 2017-11-15 |
公开(公告)号: | CN107862060B | 公开(公告)日: | 2021-03-23 |
发明(设计)人: | 王建华;王新群;赵洁;陈宇彬;何珺;丁录国;周乃鹏 | 申请(专利权)人: | 吉林大学 |
主分类号: | G06F40/30 | 分类号: | G06F40/30;G06F16/683;G10L17/02 |
代理公司: | 长春吉大专利代理有限责任公司 22201 | 代理人: | 杜森垚 |
地址: | 130012 吉*** | 国省代码: | 吉林;22 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 追踪 目标 语义 识别 装置 方法 | ||
本发明公开了一种追踪目标人的语义识别装置,包括麦克风阵列模块、说话人辨识模块、存储模块、音频数据缓存区以及语义匹配模块;麦克风阵列模块采集来自外界声场的多路音频信号并进行语音增强处理,处理后的音频信号只增强了外界声场中特定位置声源的音频信号;说话人辨识模块提取麦克风阵列模块采集的声纹特征,与目标人的声纹模型进行匹配,判断通过麦克风阵列模块增强处理后的特定声源信号是否来自于目标人;语义匹配模块识别音频中的语义信息并以一定形式输出。本发明配置了声纹提取模块和声源定位模块,可以在噪杂的外界声场中定位到目标人的声源位置,并通过音频数据缓存区和语义匹配模块将目标人的语音信号转换为目标人语义。
技术领域
本发明涉及语义识别领域,具体涉及一种追踪目标人的语义识别装置。
背景技术
目前通用的语义识别装置,往往受到干扰声源的影响,在嘈杂的场合下无法达到较高的识别成功率;识别的目标不具有可选性,不适用于需要识别特定人语义的场合;当目标声源移动时,不容易达到较高的识别成功率。
国内的申请公布号为CN105529026A,名称为“语音识别装置和语音识别方法”的专利。其包括收集器、第一存储器、学习器、第二存储器、特征向量提取器、语音识别器,致力于提供具有基于说话者的语音数据生成个人声学模型并且通过使用个人声学模型进行语音识别的优点的语音识别装置及语音识别算法。
国内的申请公布号为CN106503513A,名称为“声纹识别方法及装置”的专利。其揭示了一种声纹识别方法及装置,包括获取麦克风采集到的声音信号,获取声音信号的声纹特征;将声纹特征进行匹配等方法。
发明内容
为了适用于需要识别特定人语义的场合,本发明公开了一种追踪目标人的语义识别装置,其配置了声纹提取模块和声源定位模块,可以在噪杂的外界声场中定位到目标人的声源位置;还配置了音频数据缓存区和语义匹配模块,将目标人的语音信号转换为目标人语义。
本发明的目的是通过以下技术方案实现的:
一种追踪目标人的语义识别装置,包括麦克风阵列模块、说话人辨识模块、存储模块、音频数据缓存区以及语义匹配模块。
所述麦克风阵列模块包括语音增强模块以及麦克风矩阵;麦克风矩阵由多个麦克风音频接收端组成,多个麦克风音频接收端设置在外界声场中不同的特定空间位置,采集外界声场中的多路模拟音频信号;语音增强模块用于将麦克风矩阵采集的多路模拟音频信号按照语音增强权系数进行加权合成,加权合成后的音频信号增强了外界声场中特定位置声源的模拟音频信号;
所述说话人辨识模块包括声纹提取模块、声纹匹配模块以及声源定位模块:
声纹提取模块与所述语音增强模块通讯连接,其接收语音增强模块合成的音频信号,并根据声纹提取算法,获取音频信号中表征特定人语音特征的声纹特征;
声纹匹配模块分别与声纹提取模块以及存储模块的声纹存储库通讯连接,分别接收声纹存储库中的声纹模型以及声纹提取模块提取到的声纹特征信息,将声纹模型与声纹特征信息进行相似度匹配,并将相似度匹配结果反馈给声源定位模块;
声源定位模块分别与声纹匹配模块及麦克风阵列模块通讯连接,其接收来自麦克风阵列模块的多路模拟音频信号,以此为依据获知外界声场中不同声源的位置范围,对于每个位置范围生成一组语音增强权系数,使得语音增强模块按照语音增强权系数合成多路音频后,外界声场中特定位置范围的音频信号被增强;
所述音频数据缓存区分别与声纹匹配模块及语义匹配模块通讯连接,当声纹匹配模块匹配结果显示声纹匹配成功时,声纹匹配模块将当前经过语音增强后的音频数据暂存到音频数据缓存区暂存;
所述存储模块包括语义存储库与声纹存储库;
声纹存储库由一个或多个声纹模型组成,每一个声纹模型经过对目标语音训练获得;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于吉林大学,未经吉林大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201711126940.5/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种歌曲推荐方法及移动终端
- 下一篇:一种数据库的索引文件建立方法及检索方法