[发明专利]语音实时识别结果边界缓冲修正方法及装置在审
申请号: | 202111314223.1 | 申请日: | 2021-11-08 |
公开(公告)号: | CN114120968A | 公开(公告)日: | 2022-03-01 |
发明(设计)人: | 刘郁松;李全忠;何国涛;蒲瑶 | 申请(专利权)人: | 普强时代(珠海横琴)信息技术有限公司 |
主分类号: | G10L15/01 | 分类号: | G10L15/01;G10L15/22 |
代理公司: | 北京科亿知识产权代理事务所(普通合伙) 11350 | 代理人: | 汤牡丹 |
地址: | 519000 广东省珠海市横琴新*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 语音 实时 识别 结果 边界 缓冲 修正 方法 装置 | ||
1.一种语音实时识别结果边界缓冲修正方法,其特征在于,包括:
获取语音识别结果,识别所述语音识别结果中的语音边界信息;
采用历史边界缓冲区对预设时间段内的语音边界进行缓冲处理,得到所述语音边界的边界信息;
当有新语音边界信息进行缓冲处理时,将所述新语音边界信息与已经存在的语音边界信息进行对比,并根据对比结果对所述已经存在的语音边界的边界信息进行修正。
2.根据权利要求1所述的方法,其特征在于,所述语音边界的边界信息,包括:
时间边界值、边界对应句子的所属角色以及边界类型;
其中,所述边界类型包括开始边界和结束边界。
3.根据权利要求2所述的方法,其特征在于,所述当有新语音边界信息进行缓冲处理时,将所述新语音边界信息与已经存在的语音边界信息进行对比,并根据对比结果对所述已经存在的语音边界的边界信息进行修正,包括:
当新语音边界进行缓冲时,判断是否存在和所述新语音边界对应句子的所述角色相同的边界;
如果有,则比较新语音边界的时间边界值是否大于等于已经存在的语音边界的时间边界值,若小于,则确定边界修正后出现了错乱,则再次对所述存在的语音边界进行修正。
4.根据权利要求3所述的方法,其特征在于,所述再次对所述存在的语音边界进行修正,包括:
将新语音边界的时间边界值修正为已经存在的语音边界的时间边界值。
5.根据权利要求4所述的方法,其特征在于,所述再次对所述存在的语音边界进行修正,还包括:
对缓冲处理的所有语音边界的边界信息按照时间边界值从小到大的顺序进行排序,从结束边界的最小时间边界值依次和开始边界的最大时间边界值进行比较,如果其差值大小超过预设延迟时间,则按照从小到大的顺序依次输出边界信息。
6.根据权利要求1所述的方法,其特征在于,还包括:
在对所述已经存在的语音边界的边界信息进行修正后,再次将新的语音边界信息进行缓冲处理。
7.根据权利要求1所述的方法,其特征在于,所述获取语音识别结果,识别所述语音识别结果中的语音边界信息,包括:
获取待识别语音数据的声学特征信息和语言特征信息;
根据所述声学特征信息和语言特征信息,在预构建静态词图中确定待识别语言数据匹配的目标识别路径,记录待识别语音数据的候选识别路径中各词节点的词节点信息,根据目标识别路径获得待识别语音数据的语音识别结果,基于语音识别结果中各识别词的词标识、以及所述候选识别路径中各词节点的词节点信息,按照目标识别路径进行回溯,得到语音识别结果中各识别词在待识别语音数据中的语音边界信息。
8.一种语音实时识别结果边界缓冲修正装置,其特征在于,包括:
获取模块,用于获取语音识别结果,识别所述语音识别结果中的语音边界信息;
处理模块,用于采用历史边界缓冲区对预设时间段内的语音边界进行缓冲处理,得到所述语音边界的边界信息;
修正模块,用于当有新语音边界信息进行缓冲处理时,将所述新语音边界信息与已经存在的语音边界信息进行对比,并根据对比结果对所述已经存在的语音边界的边界信息进行修正。
9.一种计算机设备,其特征在于,包括处理器,以及与所述处理器连接的存储器;
所述存储器用于存储计算机程序,所述计算机程序用于执行上述任一实施例提供的语音实时识别结果边界缓冲修正方法;
所述处理器用于调用并执行存储器中的计算机程序。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于普强时代(珠海横琴)信息技术有限公司,未经普强时代(珠海横琴)信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111314223.1/1.html,转载请声明来源钻瓜专利网。