[发明专利]一种语音识别方法及装置有效
申请号: | 201710537548.3 | 申请日: | 2017-07-04 |
公开(公告)号: | CN109243430B | 公开(公告)日: | 2022-03-01 |
发明(设计)人: | 郑宏 | 申请(专利权)人: | 北京搜狗科技发展有限公司 |
主分类号: | G10L15/18 | 分类号: | G10L15/18;G10L15/06 |
代理公司: | 深圳市深佳知识产权代理事务所(普通合伙) 44285 | 代理人: | 王仲凯 |
地址: | 100084 北京市海淀区中关*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 语音 识别 方法 装置 | ||
本发明实施例提供一种语音识别方法和装置,所述方法包括:接收用户的语音输入,对所述语音输入进行识别,获得候选语音识别结果;利用用户的语言识别模型对所述候选语音识别结果进行排序;所述与用户对应的个人语言模型为利用所述用户的历史文本输入数据建立的语言模型;利用排序后的候选语音识别结果获得最终的语音识别结果。本发明实施例可以有效提高语音识别结果的准确性。
技术领域
本发明实施例涉及语音识别技术领域,具体涉及一种语音识别方法及装置。
背景技术
语音识别技术是一种将人类语音转换为计算机可读输入的技术。语音识别技术在语音拨号、语音导航、自动设备控制等领域都有广泛的应用。因此,如何提高语音识别的准确性成为一个重要的课题。
现有技术中,一般使用语音模型对用户输入的语音进行识别,将输入的语音特征序列转换为字符序列。语音模型一般包括声学模型和语言模型,分别对应语音到音节概率的计算以及音节到字符概率的计算。
申请人在研究现有技术的过程中发现,现有技术采用相同的语音识别模型对不同用户的语音进行识别,然而,不同用户的发音特点和语言使用习惯是不一样的,现有技术无法提供准确、个性化的语音识别结果。尽管现有技术存在一种方法,可以应用用户的个人声学模型对用户语音进行识别得到识别结果,但这种方法仅仅考虑了用户的发音特点,例如用户所属的方言类别,这种方法仍然不能够提供更为精确、个性化的语音识别结果。
发明内容
本发明实施例旨在提供一种语音识别方法及装置,可以利用通用语言模型以及与所述用户对应的个人语言模型对候选语音识别结果进行排序,得到更为准确的、个性化的语音识别结果。
为此,本发明实施例提供如下技术方案:
第一方面,本发明实施例提供了一种语音识别方法,包括:接收用户的语音输入,对所述语音输入进行识别,获得候选语音识别结果;利用用户的语言识别模型对所述候选语音识别结果进行排序;其中,所述用户的语言识别模型通过通用语言模型以及与用户对应的个人语言模型获得,所述与用户对应的个人语言模型为利用所述用户的历史文本输入数据建立的语言模型;利用排序后的候选语音识别结果获得最终的语音识别结果。
第二方面,本发明实施例提供了一种语音识别装置,包括:识别单元,用于接收用户的语音输入,对所述语音输入进行识别,获得候选语音识别结果;排序单元,用于利用用户的语言识别模型对所述候选语音识别结果进行排序;其中,所述用户的语言识别模型通过通用语言模型以及与用户对应的个人语言模型获得,所述与用户对应的个人语言模型为利用所述用户的历史文本输入数据建立的语言模型;结果获得单元,用于利用排序后的候选语音识别结果获得最终的语音识别结果。
第三方面,本发明实施例提供了一种用于语音识别的装置,包括有存储器,以及一个或者一个以上的程序,其中一个或者一个以上程序存储于存储器中,且经配置以由一个或者一个以上处理器执行所述一个或者一个以上程序包含用于进行以下操作的指令:接收用户的语音输入,对所述语音输入进行识别,获得候选语音识别结果;利用用户的语言识别模型对所述候选语音识别结果进行排序;其中,所述用户的语言识别模型通过通用语言模型以及与用户对应的个人语言模型获得,所述与用户对应的个人语言模型为利用所述用户的历史文本输入数据建立的语言模型;利用排序后的候选语音识别结果获得最终的语音识别结果。
第四方面,本发明实施例提供了一种机器可读介质,其上存储有指令,当由一个或多个处理器执行时,使得装置执行如第一方面所示的语音识别方法。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京搜狗科技发展有限公司,未经北京搜狗科技发展有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710537548.3/2.html,转载请声明来源钻瓜专利网。