[发明专利]一种用于语音识别芯片的智能修正方法及系统有效
申请号: | 202211565405.0 | 申请日: | 2022-12-07 |
公开(公告)号: | CN115579000B | 公开(公告)日: | 2023-03-03 |
发明(设计)人: | 王嘉诚;张少仲;张栩 | 申请(专利权)人: | 中诚华隆计算机技术有限公司 |
主分类号: | G10L15/02 | 分类号: | G10L15/02;G10L15/26;G06F40/30;G06F18/22 |
代理公司: | 北京智燃律师事务所 11864 | 代理人: | 柴琳琳 |
地址: | 100012 北京市朝*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 用于 语音 识别 芯片 智能 修正 方法 系统 | ||
1.一种用于语音识别芯片的智能修正方法,其特征在于,包括:
步骤1:获取目标语音以及目标语音的标准文本;
步骤2:采用语音识别芯片识别所述目标语音,获取第一文本,与所述标准文本进行相似度分析,得到第一相似结果;
步骤3:当第一相似结果大于或等于预设值时,按照预设方式修正语音识别芯片的识别构架;
步骤4:当第一相似结果小于预设值时,获取目标语音的语音场景,并根据语音场景的场景特征以及两个文本之间的文本差异特征,来构建每个文本差异特征的修正特征;
步骤5:预测修正特征对两个文本差异的修正级别,根据修正级别对修正特征进行调整,按照所述修正特征对所述语音识别芯片的识别构架进行修正;
否则,按照预设标准对修正特征进行持续优化;
其中,所述步骤2具体包括:
通过语音识别芯片接收目标语音,对所述目标语音进行频谱分析和降噪处理,得到第一处理结果;
对所述第一处理结果进行特征提取,获取得到目标语音特征;
调取语音识别芯片中的历史关键词语列表中的关键词语特征与所述目标语音特征进行对比匹配,得到对比结果;
分析所述对比结果,确定匹配度最高的关键词语为第一识别结果;
按照第一识别结果的识别顺序进行有序组合,构成第一文本;
对所述第一文本与标准文本进行相似度对比,得出第一相似结果;
其中,对所述第一文本与标准文本进行相似度对比,得出第一相似结果,包括;
获取所述标准文本的标准特征向量;
获取所述第一文本的第一特征向量;
分别对所述标准特征向量和第一特征向量归一化处理,得到标准文本向量和第一文本向量;
对所述标准文本向量和第一文本向量进行相似度集合,其中,表示所述标准文本向量和第一文本向量中第i个元素之间的距离;表示所述标准文本向量和第一文本向量中的元素个数;
其中,的取值范围[0,];表示第i个元素的元素类型;表示正向影响的元素集合;的取值范围[0,];表示负向影响的元素集合;为标准文本向量中第i个元素的坐标点;表示第一文本向量中第i个元素的坐标点;
根据所述相似度集合D,筛选出满足标准距离条件的第一距离;
基于所有第一距离,确定出第一相似结果。
2.如权利要求1所述的用于语音识别芯片的智能修正方法,其特征在于,
所述目标语音是指目标对象在特定环境中发出的语音并由指定录音装置进行存储得到的音频;
所述标准文本是通过人为预先识别获取的。
3.如权利要求1所述的用于语音识别芯片的智能修正方法,其特征在于,基于所有第一距离,确定出第一相似结果,包括:
计算所有第一距离的累计和:
其中,表示第j1个第一距离;m1表示从相似度集合中筛选出来满足标准距离条件的第一距离的总个数;
当以及时,将作为第一相似结果;
其中,表示相似度集合中所有的累加和;1表示第一常数;2表示第二常数。
4.如权利要求1所述的用于语音识别芯片的智能修正方法,其特征在于,
获取目标语音的语音场景之后,还包括:
提取所述目标语音中非语音片段,并依次对每个非语音片段进行第一位置标注;
对每个非语音片段进行特征提取,获取对应子场景特征;
基于标注结果,集合所有子场景特征,确定所述语音场景的场景特征。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中诚华隆计算机技术有限公司,未经中诚华隆计算机技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202211565405.0/1.html,转载请声明来源钻瓜专利网。