[发明专利]一种基于角度谱特征的多通道远场的目标语音识别方法有效
申请号: | 202010098250.9 | 申请日: | 2020-02-18 |
公开(公告)号: | CN113345421B | 公开(公告)日: | 2022-08-02 |
发明(设计)人: | 张鹏远;李文洁;颜永红 | 申请(专利权)人: | 中国科学院声学研究所;中科信利(广州)技术有限公司 |
主分类号: | G10L15/02 | 分类号: | G10L15/02;G10L15/22;G10L15/16;G10L19/02;G10L19/26;G10L25/24 |
代理公司: | 北京亿腾知识产权代理事务所(普通合伙) 11309 | 代理人: | 陈霁 |
地址: | 100190 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开了一种基于角度谱特征的多通道远场的目标语音识别方法,包括:获取包含目标人语音的M个通道的混合语音;将两个通道组成通道对,得到H个不重复的通道对。提取M个通道的混合语音的MFCC特征,并串接,得到第一特征;计算H个通道对的SRP‑PHAT,根据SRP‑PHAT生成包含目标人的位置信息的角度谱特征作为第二特征;提取出预存的目标人特征作为第三特征;根据第一特征、第二特征和第三特征对混合语音中的目标人进行语音识别。同时说话人的位置信息的引入也能增强模型对于多通道远场信号的处理能力,从而进一步提升模型对于目标说话人语音的识别性能。 | ||
搜索关键词: | 一种 基于 角度 特征 通道 目标 语音 识别 方法 | ||
【主权项】:
暂无信息
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国科学院声学研究所;中科信利(广州)技术有限公司,未经中国科学院声学研究所;中科信利(广州)技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/202010098250.9/,转载请声明来源钻瓜专利网。
- 上一篇:一种电梯板材的压力结构
- 下一篇:一种电梯板材的驱动稳定结构