[发明专利]语音识别方法、装置及存储介质有效
| 申请号: | 201710451642.7 | 申请日: | 2017-06-15 |
| 公开(公告)号: | CN109145281B | 公开(公告)日: | 2020-12-25 |
| 发明(设计)人: | 李秀林 | 申请(专利权)人: | 北京嘀嘀无限科技发展有限公司 |
| 主分类号: | G06F40/284 | 分类号: | G06F40/284;G06F16/33;G10L15/26 |
| 代理公司: | 北京友联知识产权代理事务所(普通合伙) 11343 | 代理人: | 尚志峰;汪海屏 |
| 地址: | 100193 北京*** | 国省代码: | 北京;11 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 语音 识别 方法 装置 存储 介质 | ||
1.一种语音识别方法,其特征在于,所述方法包括:
获取当前用户提供的待识别语音信息的至少两个候选识别结果及其分数;
根据预设的关键词提取规则,从每个候选识别结果中提取预设类型的关键词汇;
利用所提取到的关键词汇以及候选识别结果的分数,对每个候选识别结果的分数进行修正,并根据修正结果确定所述待识别语音信息的最终识别结果;
所述利用所提取到的关键词汇以及候选识别结果的分数,对每个候选识别结果的分数进行修正,包括:
根据所提取到的关键词汇与预设的样本库中关键词汇样本的相似度,确定所述关键词汇对应的候选识别结果的加权值;
基于所述加权值对所述候选识别结果的分数进行修正,获得所述候选识别结果修正后的分数。
2.根据权利要求1所述的方法,其特征在于,所述预设的样本库中还包含以下一种或多种信息:
关键词汇样本的热度信息、所述当前用户使用关键词汇样本的历史信息。
3.根据权利要求2所述的方法,其特征在于,若预设的样本库中还包括关键词汇样本的热度信息,所述根据所提取到的关键词汇与预设的样本库中关键词汇样本的相似度,确定所述关键词汇对应的候选识别结果的加权值,包括:
确定所提取的关键词汇与关键词汇样本的相似度;
筛选出相似度大于相似度阈值的关键词汇样本;
基于预设的热度信息到热度加权值的转换关系,将筛选出的关键词汇样本的热度信息转换为热度加权值;
基于转换获得的热度加权值确定所述关键词汇对应的候选识别结果的加权值。
4.根据权利要求3所述的方法,其特征在于,所述热度信息包括不同的周期性的统计时段下的热度值;
所述基于预设的热度信息到热度加权值的转换关系,将筛选出的关键词汇样本的热度信息转换为热度加权值,包括:
确定当前时间所属的统计时段;
从筛选出的关键词汇样本的热度值中,筛选出所述统计时段下的热度值;
基于预设的热度值到热度加权值的转换关系,将筛选出的热度值转换为热度加权值。
5.根据权利要求2所述的方法,其特征在于,所述预设的样本库中还包含关键词汇样本的热度信息、所述当前用户使用关键词汇样本的历史信息;
所述根据所提取到的关键词汇与预设的样本库中关键词汇样本的相似度,确定所述关键词汇对应的候选识别结果的加权值,包括:
确定所提取到的关键词汇与预设的样本库中关键词汇样本的相似度;
基于相似度与检索加权值的转换关系,将所确定的相似度转换为检索加权值;
获取所提取到的关键词汇与具有历史信息的关键词汇样本的相似度,基于相似度与偏好加权值的转换关系,将所获取的相似度转换为偏好加权值;
基于所确定的相似度、关键词汇样本的热度信息、以及预设的热度信息到热度加权值的转换关系,获得热度加权值;
将所述偏好加权值和热度加权值中的最大值,与所述检索加权值相乘或相加,获得所述关键词汇对应的候选识别结果的加权值;
其中,针对相同相似度,利用相似度与偏好加权值的转换关系转换获得的偏好加权值,比利用相似度与检索加权值的转换关系转换获得的检索加权值大。
6.一种语音识别装置,其特征在于,所述装置包括:
信息获取模块,用于:获取当前用户提供的待识别语音信息的至少两个候选识别结果及其分数;
信息提取模块,用于:根据预设的关键词提取规则,从每个候选识别结果中提取预设类型的关键词汇;
结果确定模块,用于:利用所提取到的关键词汇以及候选识别结果的分数,对每个候选识别结果的分数进行修正,并根据修正结果确定所述待识别语音信息的最终识别结果;
所述结果确定模块包括:
加权值确定模块,用于:根据所提取到的关键词汇与预设的样本库中关键词汇样本的相似度,确定所述关键词汇对应的候选识别结果的加权值;
信息修正模块,用于:基于所述加权值对所述候选识别结果的分数进行修正,获得所述候选识别结果修正后的分数。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京嘀嘀无限科技发展有限公司,未经北京嘀嘀无限科技发展有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710451642.7/1.html,转载请声明来源钻瓜专利网。
- 上一篇:信息推送的方法和装置
- 下一篇:断句模型训练方法、断句方法、装置及计算机设备





