[发明专利]解码方法、解码器及存储介质有效
申请号: | 201810020113.6 | 申请日: | 2018-01-09 |
公开(公告)号: | CN108305634B | 公开(公告)日: | 2020-10-16 |
发明(设计)人: | 黄羿衡;蒲松柏 | 申请(专利权)人: | 深圳市腾讯计算机系统有限公司 |
主分类号: | G10L19/24 | 分类号: | G10L19/24;G10L25/69;G10L15/14;G10L15/18 |
代理公司: | 北京派特恩知识产权代理有限公司 11270 | 代理人: | 崔晓岚;张颖玲 |
地址: | 518057 广东省深圳市南*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 解码 方法 解码器 存储 介质 | ||
本发明提供了一种解码方法、解码器及存储介质;方法包括:将原始语言模型拆分为低阶语言模型和差分语言模型,所述低阶语言模型的阶数低于所述源语言模型,所述差分语言模型为所述原始语言模型与所述低阶语言模型的差分;使用基于所述低阶语言模型形成的第一解码网络,对语音信号进行解码得到路径以及对应的评分,以及,使用基于所述差分语言模型形成的第二解码网络,对所述解码路径进行重评分;将满足评分条件的路径包括的输出符号作为识别结果输出。
技术领域
本发明涉及计算机技术,尤其涉及自动语音识别技术的解码方法、解码器及存储介质。
背景技术
自动语音识别技术用于模拟的语音信号转换为计算机可以处理的文本,在语音拨号、电话订票、语音输入、翻译系统、语音导航等各种业务中得到广泛应用。
解码器作为自动语音识别系统的核心,用于在解码网络搜索语音信号的解码路径,输出最佳解码路径中串联的节点作为语音识别的结果,解码器直接影响自动语音识别系统的识别效率和精度。
相关技术提供的解码器,依赖于语言模型等知识源进行构建的解码空间汇中搜索解码路径,工业级别的语言模型的体积往往很大,在此基础上构建的解码空间的体积又在语言模型的基础上进一步放大,如果需要保证解码效率则需要在解码过程中需要部署大量的存储资源和计算资源,而工业应用中有限的资源制约了解码效率。
发明内容
本发明实施例提供一种解码方法、解码器及存储介质,能够以资源集约的方式实现语音信号的高效率解码。
本发明实施例的技术方案是这样实现的:
本发明实施例提供一种解码方法,包括:
将原始语言模型拆分为低阶语言模型和差分语言模型,所述低阶语言模型的阶数低于所述源语言模型,所述差分语言模型为所述原始语言模型与所述低阶语言模型的差分;
使用基于所述低阶语言模型形成的第一解码网络,对语音信号进行解码得到路径以及对应的评分,以及,
使用基于所述差分语言模型形成的第二解码网络,对所述解码路径进行重评分;
将满足评分条件的路径包括的输出符号作为识别结果输出。
上述方案中,还包括:当所述下一令牌的已有的伴生假设集合为空时,将假设集合链表加入到所述下一令牌的伴生假设集合中。
本发明实施例提供一种解码器,包括:
解码网络模块,将原始语言模型拆分为低阶语言模型和差分语言模型,所述低阶语言模型的阶数低于所述源语言模型,所述差分语言模型为所述原始语言模型与所述低阶语言模型的差分;
解码模块,用于使用基于所述低阶语言模型形成的第一解码网络,对语音信号进行解码得到路径以及对应的评分,以及,
所述解码模块,还用于使用基于所述差分语言模型形成的第二解码网络,对所述解码路径进行重评分;
将满足评分条件的路径包括的输出符号作为识别结果输出。
上述方案中,所述解码网络模块,还用于在加权有限状态转换器中融合所述低阶语言模型,通过融合得到所述第一解码网络,或者,
在加权有限状态转换器中融合所述低阶语言模型、发音词典和声学模型,通过融合得到所述第一解码网络。
上述方案中,所述解码模块,还用于针对所述语音信号的每个帧执行如下处理:
初始化所述第一解码网络中的令牌列表,以及,遍历在所述令牌列表中的令牌;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于深圳市腾讯计算机系统有限公司,未经深圳市腾讯计算机系统有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810020113.6/2.html,转载请声明来源钻瓜专利网。