[发明专利]音频识别方法、装置、电子设备及存储介质在审
申请号: | 202111599621.2 | 申请日: | 2021-12-24 |
公开(公告)号: | CN114299923A | 公开(公告)日: | 2022-04-08 |
发明(设计)人: | 李良斌;陈孝良 | 申请(专利权)人: | 北京声智科技有限公司 |
主分类号: | G10L15/02 | 分类号: | G10L15/02;G10L15/10;G10L15/22;G10L15/06 |
代理公司: | 北京三高永信知识产权代理有限责任公司 11138 | 代理人: | 王静 |
地址: | 100094 北京市海淀*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 音频 识别 方法 装置 电子设备 存储 介质 | ||
本申请提供了一种音频识别方法、装置、电子设备及存储介质,属于计算机技术领域。该方法包括:将当前采集的音频帧与之前采集的音频帧构成一个音频片段,并获取音频片段的第一特征值、第二特征值和第三特征值;在第一特征值与第二特征值之间的差值小于第一阈值,且第三特征值满足跳转条件的情况下,确定音频片段中包含唤醒词。第一特征值表示音频片段中前N个音频帧属于唤醒词的概率值,第二特征值表示音频片段中前N个音频帧与音素片段匹配的概率值,音素片段是由前N个音频帧识别出的音素构成的片段,第三特征值满足跳转条件表示第N个音频帧与第N+1个音频帧不属于唤醒词中相邻的两个音素。该方法能够提高音频识别的准确率。
技术领域
本申请涉及计算机技术领域,特别涉及一种音频识别方法、装置、电子设备及存储介质。
背景技术
随着音频识别技术的快速发展,音频识别技术被广泛应用于各种电子设备上,如智能穿戴设备、手机、平板电脑、智能家电等。用户说出唤醒词,即可唤醒该电子设备,从而控制该电子设备执行相应的操作。但是经常出现用户还未说完唤醒词,电子设备就基于音频数据识别出某个唤醒词的情况,但是所识别出的唤醒词不一定是用户真正要说的那个唤醒词本身,因此音频识别的准确率较低。
发明内容
本申请实施例提供了一种音频识别方法、装置、电子设备及存储介质,能够提高音频识别的准确率,所述技术方案如下:
根据本申请实施例的一方面,提供了一种音频识别方法,所述方法包括:
在采集到音频帧时,将当前采集的音频帧与之前采集的音频帧构成一个音频片段,并获取所述音频片段的第一特征值、第二特征值和第三特征值;
在所述第一特征值与所述第二特征值之间的差值小于第一阈值,且所述第三特征值满足跳转条件的情况下,确定所述音频片段中包含唤醒词;
其中,所述音频片段包括N+1个音频帧,相邻的两个音频片段包括至少一个相同的音频帧,N为正整数,且N等于所述唤醒词包含的音素的数量;所述第一特征值表示所述音频片段中前N个音频帧属于所述唤醒词的概率值,所述第二特征值表示所述音频片段中前N个音频帧与音素片段匹配的概率值,所述音素片段是由所述前N个音频帧识别出的音素构成的片段,所述第三特征值表示所述音频片段中第N个音频帧与第N+1个音频帧属于所述唤醒词中相邻的两个音素的概率值,所述跳转条件表示所述音频片段中第N个音频帧与第N+1个音频帧不属于所述唤醒词中相邻的两个音素。
在一种可能的实现方式中,所述方法还包括:
在所述第一特征值与所述第二特征值之间的差值小于所述第一阈值,且所述第三特征值不满足所述跳转条件的情况下,继续采集音频帧,直至本次构成的音频片段的所述第一特征值与所述第二特征值之间的差值小于所述第一阈值,且所述第三特征值满足所述跳转条件,确定所述本次构成的音频片段中包含唤醒词。
在一种可能的实现方式中,获取所述第一特征值和所述第二特征值,包括:
获取所述音频片段中前N个音频帧的第一特征分量和第二特征分量,其中,第K个音频帧的第一特征分量表示所述第K个音频帧属于所述唤醒词中的第K个音素的概率值,所述第K个音频帧的第二特征分量表示所述第K个音频帧属于多个音素的概率值中的最大概率值,K为不大于N的正整数;
将所述前N个音频帧中的每个音频帧的第一特征分量相加,得到所述音频片段的所述第一特征值;
将所述前N个音频帧中的每个音频帧的第二特征分量相加,得到所述音频片段的所述第二特征值。
在一种可能的实现方式中,所述获取所述音频片段中前N个音频帧的第一特征分量和第二特征分量,包括:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京声智科技有限公司,未经北京声智科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111599621.2/2.html,转载请声明来源钻瓜专利网。