[发明专利]语音识别处理方法及系统、设备以及存储介质在审
申请号: | 202111527196.6 | 申请日: | 2021-12-14 |
公开(公告)号: | CN114267339A | 公开(公告)日: | 2022-04-01 |
发明(设计)人: | 李飞腾 | 申请(专利权)人: | 上海流利说信息技术有限公司 |
主分类号: | G10L15/04 | 分类号: | G10L15/04;G10L15/20 |
代理公司: | 上海知锦知识产权代理事务所(特殊普通合伙) 31327 | 代理人: | 吴凡 |
地址: | 200090 上海市杨浦区长阳路*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 语音 识别 处理 方法 系统 设备 以及 存储 介质 | ||
一种语音识别处理方法及系统、设备以及存储介质,所述语音识别处理方法包括:获取语音数据;对所述语音数据进行解码处理,获得当前词对应的中间识别结果;从获得所述中间识别结果时起停顿时长为第一预设时长时,判断需要产生第一语音端点;从获得所述中间识别结果时起停顿时长为第二预设时长时,进行重打分处理,获得重打分结果;所述第二预设时长小于或等于所述第一预设时长;基于所述第一语音端点,输出所述重打分结果为最终识别结果。本发明实施例有利于改善语音识别的端点延迟。
技术领域
本发明实施例涉及语音交互领域,尤其涉及一种语音识别处理方法及系统、设备以及存储介质。
背景技术
随着移动互联网技术的发展,包括语音识别在内的与自然语言处理相关技术获得了蓬勃发展。实时双工语音交互指的是用户和引擎可以相互随时发送信息流/拥有双向通信的语音交互,特别是长时链接的人机对话请求,比如说在线教育。
例如:在线教育的一个场景为AI(Artificial Intelligence)老师课,在这个场景下语音识别处理需要全程在后台处理用户的音频并返回结果。如同其它人机交互场景一样,AI老师需要模拟真人拥有处理打断、合理时间回复以及自然停顿等特性。衡量AI老师回复快慢的指标,可以标志为“端到端延迟”,这部分通常会在一个合理的停顿时间间隔来模拟正常对话场景下的自然停顿。如果太快会有抢话打断的表现,太慢即表现为延迟太快,反应太慢。
“端到端延迟”会由一系列部分延迟累加,其中包括语音识别处理(AutomaticSpeech Recognition,ASR),语音合成(Text to Speech,TTS),对话管理(DialogManagement,DM),自然语言理解(Natural Language Understanding,NLU)等,常见的会留有一个动态调整的主动等待时间,以满足“端到端延迟”均值在预计值左右。其中,语音识别处理中,一句完整的话最后一个单词结束的时间戳至收到最终识别结果的时间差,定义为端点延迟(Endpoint Latency)。
但是,目前语音识别的端点延迟仍有待优化。
发明内容
本发明实施例解决的问题是提供一种语音识别处理方法及系统、设备以及存储介质,改善语音识别的端点延迟。
为解决上述问题,本发明实施例提供一种语音识别处理方法,包括:获取语音数据;对所述语音数据进行解码处理,获得当前词对应的中间识别结果;从获得所述中间识别结果时起停顿时长为第一预设时长时,判断需要产生第一语音端点;从获得所述中间识别结果时起停顿时长为第二预设时长时,进行重打分处理,获得重打分结果;所述第二预设时长小于或等于所述第一预设时长;基于所述第一语音端点,输出所述重打分结果为最终识别结果。
相应的,本发明实施例还提供一种语音识别处理系统,包括:语音获取模块,用于获取语音数据;解码模块,用于对所述语音数据进行解码处理,获得当前词对应的中间识别结果;端点判断模块,用于从获得所述中间识别结果时起停顿时长为第一预设时长时,判断需要产生第一语音端点;重打分模块,用于从获得所述中间识别结果时起停顿时长为第二预设时长时,进行重打分处理,获得重打分结果;所述第二预设时长小于或等于所述第一预设时长;识别结果输出模块,用于基于所述第一语音端点,输出所述重打分结果为最终识别结果。
相应的,本发明实施例还提供一种设备,包括至少一个存储器和至少一个处理器,所述存储器存储有一条或多条计算机指令,其中,所述一条或多条计算机指令被所述处理器执行以实现本发明实施例提供的语音识别处理方法。
相应的,本发明实施例还提供一种存储介质,所述存储介质存储有一条或多条计算机指令,所述一条或多条计算机指令用于实现本发明实施例提供的语音识别处理方法。
与现有技术相比,本发明实施例的技术方案具有以下优点:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海流利说信息技术有限公司,未经上海流利说信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111527196.6/2.html,转载请声明来源钻瓜专利网。