[发明专利]处理方法、装置和机器可读介质有效
申请号: | 201710632930.2 | 申请日: | 2017-07-28 |
公开(公告)号: | CN107564526B | 公开(公告)日: | 2020-10-27 |
发明(设计)人: | 郑宏 | 申请(专利权)人: | 北京搜狗科技发展有限公司 |
主分类号: | G10L15/26 | 分类号: | G10L15/26;G10L15/22 |
代理公司: | 北京润泽恒知识产权代理有限公司 11319 | 代理人: | 莎日娜 |
地址: | 100084 北京市海淀区中关*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 处理 方法 装置 机器 可读 介质 | ||
1.一种处理方法,其特征在于,包括:
从语音信号对应的源文本中获取标点符号对应的目标词;
将所述源文本包括的目标词替换为对应的标点符号,以得到所述语音信号对应的目标文本;
在所述目标文本对应的语言模型得分与所述源文本对应的语言模型得分之间的比较结果符合第一预置条件的情况下,将所述目标文本作为所述语音信号对应的语音识别结果输出;
所述第一预置条件包括:目标文本对应的语言模型得分相对于所述源文本对应的语言模型得分的增加幅度超过第一幅度阈值;所述第一幅度阈值为依据所述源文本所包括的字词数量得到;所述字词数量对应的数量等级包括:第一字词数量等级和第二字词数量等级;所述第一字词数量等级对应的字词数量小于第二字词数量等级对应的字词数量,所述第一字词数量等级对应的第一幅度阈值大于第二字词数量等级对应的第一幅度阈值。
2.根据权利要求1所述的方法,其特征在于,所述目标词的数量为多个,所述将所述源文本包括的目标词替换为对应的标点符号,包括:
按照预设顺序,从多个所述目标词中获取当前需要替换的一个目标词,作为当前目标词;
将当前目标词替换为对应的标点符号,所述当前目标词包括在当前次替换对应的替换前文本中;以得到当前次替换对应的替换后文本,在完成所有当前目标词对应的替换后,得到所述语音信号对应的目标文本。
3.根据权利要求2所述的方法,其特征在于,当前次替换成功的条件包括:当前次替换所对应替换后文本的语言模型得分与当前次替换所对应替换前文本的语言模型得分之间的比较结果符合第二预置条件。
4.根据权利要求2所述的方法,其特征在于,若当前次替换所对应替换后文本的语言模型得分与当前次替换所对应替换前文本的语言模型得分之间的比较结果符合第二预置条件,则将下一次替换对应的替换前文本为当前次替换对应的替换后文本;或者
若当前次替换所对应替换后文本的语言模型得分与当前次替换所对应替换前文本的语言模型得分不符合第二预置条件,则将下一次替换对应的替换前文本为当前次替换对应的替换前文本。
5.根据权利要求3或4所述的方法,其特征在于,所述第二预置条件包括:当前次替换所对应替换后文本的语言模型得分不低于当前次替换所对应替换前文本的语言模型得分。
6.根据权利要求5所述的方法,其特征在于,所述第二预置条件包括:当前次替换所对应替换后文本的语言模型得分相对于当前次替换所对应替换前文本的语言模型得分的增加幅度超过第二幅度阈值。
7.根据权利要求6所述的方法,其特征在于,所述第二幅度阈值为依据所述源文本所包括的字词数量得到。
8.根据权利要求1所述的方法,其特征在于,在所述将所述目标文本作为所述语音信号对应的语音识别结果输出之前,所述方法还包括:
确定所述目标文本对应的句法分析结果符合预设规则。
9.一种处理装置,其特征在于,包括:
目标词获取模块,用于从语音信号对应的源文本中获取标点符号对应的目标词;
目标词替换模块,用于将所述源文本包括的目标词替换为对应的标点符号,以得到所述语音信号对应的目标文本;以及
识别结果输出模块,用于在所述目标文本对应的语言模型得分与所述源文本对应的语言模型得分之间的比较结果符合第一预置条件的情况下,将所述目标文本作为所述语音信号对应的语音识别结果输出;
所述第一预置条件包括:目标文本对应的语言模型得分相对于所述源文本对应的语言模型得分的增加幅度超过第一幅度阈值;所述第一幅度阈值为依据所述源文本所包括的字词数量得到;所述字词数量对应的数量等级包括:第一字词数量等级和第二字词数量等级;所述第一字词数量等级对应的字词数量小于第二字词数量等级对应的字词数量,所述第一字词数量等级对应的第一幅度阈值大于第二字词数量等级对应的第一幅度阈值。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京搜狗科技发展有限公司,未经北京搜狗科技发展有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710632930.2/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种耳机接听方法、装置以及耳机
- 下一篇:嵌入式系统的汉英双语语音识别方法