[发明专利]语音识别方法、装置及存储介质有效
| 申请号: | 201710451642.7 | 申请日: | 2017-06-15 |
| 公开(公告)号: | CN109145281B | 公开(公告)日: | 2020-12-25 |
| 发明(设计)人: | 李秀林 | 申请(专利权)人: | 北京嘀嘀无限科技发展有限公司 |
| 主分类号: | G06F40/284 | 分类号: | G06F40/284;G06F16/33;G10L15/26 |
| 代理公司: | 北京友联知识产权代理事务所(普通合伙) 11343 | 代理人: | 尚志峰;汪海屏 |
| 地址: | 100193 北京*** | 国省代码: | 北京;11 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 语音 识别 方法 装置 存储 介质 | ||
本申请提供一种语音识别方法、装置及存储介质,涉及计算机技术领域,所述方法包括:获取当前用户提供的待识别语音信息的至少两个候选识别结果及其分数;根据预设的关键词提取规则,从每个候选识别结果中提取预设类型的关键词汇;利用所提取到的关键词汇以及候选识别结果的分数,对每个候选识别结果的分数进行修正,并根据修正结果确定所述待识别语音信息的最终识别结果。由于本申请实施例利用从候选识别结果中提取到的关键词汇对候选识别结果的分数进行修正,实现将关键词汇作为修正的因素,可以使各个候选识别结果获得更加准确的分数,从而根据修正后的分数筛选出更加准确的识别结果。
技术领域
本申请涉及计算机技术领域,尤其涉及语音识别方法、装置及存储介质。
背景技术
随着计算机技术的发展,语音识别(Automatic Speech Recognition,ASR)技术在人机交互等领域的应用越来越多。目前,语音识别技术主要通过信号处理模块、特征提取模块、声学模型、语言模型(Language Model,LM)、发音字典和解码器(Decoder),将待识别的语音信息转换为文本信息,完成语音识别。
如图1所示,图1是相关技术中语音识别的流程图。在语音识别过程中,可以先将待识别的语音信息划分成多个语音信息帧,然后通过消除噪音、信道失真等处理对各语音信息帧进行增强,再将各语音信息帧从时域转化到频域,并从转换后的语音信息帧内提取合适的声学特征。而根据训练语音库的特征参数训练出的声学模型,以所提取的声学特征作为输入,映射到能够描述语音信息帧的发音特征的发音、并计算出语音信息帧映射到各发音的概率。
语言模型含有不同的字词(如:字、词、短语)之间关联关系、及其概率(可能性),用于估计由不同字词组成的各种文本信息的可能性。解码器可以基于己经训练好的声学模型、语言模型及发音字典建立一个识别网络,识别网络中的各路径分别与各文本信息、以及各文本信息的发音对应。然后针对声学模型输出的发音,利用识别网络对每条路径进行打分,获得候选识别结果及其分值,将分值最高的候选识别结果作为该语音信息对应的文本信息,完成语音识别。
语音识别可以应用在多种场景中,例如,网约车场景、车载系统中语音定位目的地场景等。在特定的场景中,可以根据语音识别结果中的关键词汇执行相应的服务。关键词汇可以是识别结果中预设类型的词汇,以网约车场景为例,关键词汇可以是用于描述位置的词汇,例如,POI(Point Of Interest,兴趣点/信息点)。当用户语音输入出行数据时,设备根据出行数据中的位置信息进行网约车服务。由于每种场景中关键词的数量众多,加上环境、口音等众多因素的影响,仅根据语言模型中字词间的关联性、以及声学模型中语音信息与发音的关联性,对语音信息的候选识别结果进行打分,将分值最高的候选识别结果作为该语音信息对应的文本信息,会出现语音识别结果不准确的现象。
发明内容
基于此,本申请提供了语音识别方法、装置及存储介质。
一种语音识别方法,所述方法包括:
获取当前用户提供的待识别语音信息的至少两个候选识别结果及其分数;
根据预设的关键词提取规则,从每个候选识别结果中提取预设类型的关键词汇;
利用所提取到的关键词汇以及候选识别结果的分数,对每个候选识别结果的分数进行修正,并根据修正结果确定所述待识别语音信息的最终识别结果。
在一个可选的实现方式中,所述利用所提取到的关键词汇以及候选识别结果的分数,对每个候选识别结果的分数进行修正,包括:
根据所提取到的关键词汇与预设的样本库中关键词汇样本的相似度,确定所述关键词汇对应的候选识别结果的加权值;
基于所述加权值对所述候选识别结果的分数进行修正,获得所述候选识别结果修正后的分数。
在一个可选的实现方式中,所述预设的样本库中还包含以下一种或多种信息:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京嘀嘀无限科技发展有限公司,未经北京嘀嘀无限科技发展有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710451642.7/2.html,转载请声明来源钻瓜专利网。
- 上一篇:信息推送的方法和装置
- 下一篇:断句模型训练方法、断句方法、装置及计算机设备





