[发明专利]一种交互式热词更新的语音识别方法与系统在审
申请号: | 202010016662.3 | 申请日: | 2020-01-08 |
公开(公告)号: | CN113178194A | 公开(公告)日: | 2021-07-27 |
发明(设计)人: | 闫博群;马家旭;汪俊;李索恒;张志齐 | 申请(专利权)人: | 上海依图信息技术有限公司 |
主分类号: | G10L15/26 | 分类号: | G10L15/26;G10L15/16;G10L15/10;G10L15/06 |
代理公司: | 上海市汇业律师事务所 31325 | 代理人: | 王函 |
地址: | 200126 上海市*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 交互式 更新 语音 识别 方法 系统 | ||
1.一种交互式热词更新的语音识别方法,其特征在于,包括以下步骤:
对接收的音频进行识别、转写后输出识别文本结果;
判断该识别文本结果是否准确;若准确,则输出该识别文本结果;若不准确,则增加热词;
将所述识别文本结果与热词结合进行识别、转写后输出结合文本结果并进行上述判断,若准确,则输出该结合文本结果;若不准确,则增加热词,重复上一个步骤,直至判断准确,输出该结合文本结果。
2.如权利要求1所述的一种交互式热词更新的语音识别方法,其特征在于,所述对接收的音频进行识别、转写的过程还包括对音频的解码,生成解码结果,所述解码结果包含在所述识别文本结果中,并对所述识别文本结果进行缓存。
3.如权利要求1所述的一种交互式热词更新的语音识别方法,其特征在于,所述输出结合文本结果之前对该文本结果进行打分生成字级别的解码分数,所述输出的结合文本结果包括文本、以及打分生成的字级别的解码分数。
4.一种交互式热词更新的语音识别系统,其特征在于,包括:
语音识别单元,用于接收音频并进行识别、转写后生成识别文本结果;
文本判断单元,用于判断识别文本结果是否准确;
判断处理单元,若判断为准确,则输出该识别本文结果,若判断不准确,则需增加热词;
热词增加单元,用于进行热词的增加;
所述语音识别单元还用于将所述识别文本结果与所述热词结合进行识别、转写后输出结合文本结果。
5.如权利要求4任一项所述的一种交互式热词更新的语音识别系统,其特征在于,所述语音识别单元还包括编码单元与解码单元;
所述编码单元用于接收所述音频并进行识别与转写并生成识别文本结果;
所述解码单元用于对所述音频进行解码并生成解码结果,将所述解码结果导入至所述识别文本结果中;
所述解码单元内设缓存单元,用于缓存解码后的所述识别文本结果;所述解码单元内设打分模块,用于生成字级别的解码分数并导入至所述识别文本结果中;
所述解码单元还用于对缓存的所述识别文本结果进行重新解码并与所述识别文本结果、所述热词结合进行识别、转写后输出结合文本结果。
6.一种交互式热词更新语音识别系统的存储器,所述存储器上存储有计算机程序与执行指令,其特征在于,该计算机程序被处理器执行时实现上述权利要求1-3中任一项所述的方法。
7.一种芯片,其特征在于,所述芯片上安装有所述存储器,用于从芯片中调所述存储器中存储的所述计算机程序并执行,使得安装有所述芯片的设备执行如权利要求1-3中任一项所述的方法。
8.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现如权利要求1-3中任一项所述的方法的步骤。
9.一种计算机程序产品,其特征在于,包括计算机程序指令,该计算机程序指令使得计算机执行如权利要求1-3中任一项所述的方法。
10.一种交互式热词更新的语音识别装置,其特征在于,包括处理器、语音识别器、编码器、解码器、存储器,所述处理器内置有判断处理器、热词处理器,所述解码器内置有缓存器;
所述语音识别器连接于所述编码器,所述编码器连接于所述解码器,所述处理器分别控制连接所述解码器、所述存储器、所述判断处理器、所述热词处理器;
所述处理器控制所述存储器运行计算机程序执行指令实现上述权利要求1-3中任一项所述的方法。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海依图信息技术有限公司,未经上海依图信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010016662.3/1.html,转载请声明来源钻瓜专利网。