[发明专利]一种语音识别方法及装置有效
申请号: | 201710537548.3 | 申请日: | 2017-07-04 |
公开(公告)号: | CN109243430B | 公开(公告)日: | 2022-03-01 |
发明(设计)人: | 郑宏 | 申请(专利权)人: | 北京搜狗科技发展有限公司 |
主分类号: | G10L15/18 | 分类号: | G10L15/18;G10L15/06 |
代理公司: | 深圳市深佳知识产权代理事务所(普通合伙) 44285 | 代理人: | 王仲凯 |
地址: | 100084 北京市海淀区中关*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 语音 识别 方法 装置 | ||
1.一种语音识别方法,其特征在于,包括:
接收用户的语音输入,对所述语音输入进行识别,获得候选语音识别结果;
利用通用语言模型、与所述用户对应的个人语言模型、与所述用户对应的群体语言模型进行线性插值,得到所述用户的语言识别模型;所述个人语言模型为利用所述用户的历史文本输入数据建立的语言模型,用于有效度量一个句子出现概率的高低,所述群体语言模型用于描述所述用户所属群体的语言特征;所述群体语言模型训练语料是与所述用户对应的相似用户群体中的部分或者全部用户的语料;所述相似用户群体包括词特征向量的相似度大于设定阈值的各用户;
利用所述用户的语言识别模型计算各候选语音识别结果的概率,根据计算的概率对各候选语音识别结果进行排序;
利用排序后的候选语音识别结果获得最终的语音识别结果。
2.根据权利要求1所述的方法,其特征在于,所述方法还包括:
获取用户的历史文本输入数据;
根据所述用户的历史文本输入数据获得所述用户的词特征和/或词组合特征,所述词特征包括词语以及词语的统计频次,所述词组合特征包括词组合以及词组合的统计频次;
利用所述用户的词特征和/或词组合特征训练得到与所述用户对应的个人语言模型。
3.根据权利要求1所述的方法,其特征在于,所述方法还包括:
预先建立各群体语言模型;
根据用户与群体语言模型的对应关系,获取与所述用户对应的群体语言模型;
其中,预先建立各群体语言模型包括:
计算不同用户间的相似度,根据计算的相似度获取各相似用户群体集合,所述相似用户群体集合包括相似度大于设定阈值的各用户;
利用相似用户群体集合的各用户的文本输入获得与相似用户群体对应的词特征和/或词组合特征,所述词特征包括词语以及词语的统计频次,所述词组合特征包括词组合以及词组合的统计频次;
利用所述与相似用户群体对应的词特征和/或词组合特征训练得到群体语言模型。
4.根据权利要求3所述的方法,其特征在于,所述计算不同用户间的相似度,根据计算的相似度获取相似用户群体集合包括:
获取不同用户的词特征向量;
将所述不同用户的各用户分别作为当前用户,计算所述当前用户的词特征向量以及其他用户的词特征向量的余弦距离,将所述余弦距离作为当前用户与其他用户的相似度;
将与当前用户的相似度大于设定阈值的用户加入与所述当前用户对应的相似用户群体集合。
5.一种语音识别装置,其特征在于,包括:
识别单元,用于接收用户的语音输入,对所述语音输入进行识别,获得候选语音识别结果;
模型获得单元,用于利用通用语言模型、与所述用户对应的个人语言模型、与所述用户对应的群体语言模型进行线性插值,得到所述用户的语言识别模型;所述个人语言模型为利用所述用户的历史文本输入数据建立的语言模型,用于有效度量一个句子出现概率的高低,所述群体语言模型用于描述所述用户所属群体的语言特征;所述群体语言模型训练语料是与所述用户对应的相似用户群体中的部分或者全部用户的语料;所述相似用户群体包括词特征向量的相似度大于设定阈值的各用户;
排序单元,用于利用所述用户的语言识别模型计算各候选语音识别结果的概率,根据计算的概率对各候选语音识别结果进行排序;
结果获得单元,用于利用排序后的候选语音识别结果获得最终的语音识别结果。
6.根据权利要求5所述的装置,其特征在于,所述装置还包括:
个人语言模型建立单元,用于建立与用户对应的个人语言模型;
其中,所述个人语言模型建立单元具体用于:获取用户的历史文本输入数据;根据所述用户的历史文本输入数据获得所述用户的词特征和/或词组合特征,所述词特征包括词语以及词语的统计频次,所述词组合特征包括词组合以及词组合的统计频次;利用所述用户的词特征和/或词组合特征训练得到与所述用户对应的个人语言模型。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京搜狗科技发展有限公司,未经北京搜狗科技发展有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710537548.3/1.html,转载请声明来源钻瓜专利网。