[发明专利]语音识别的方法、装置、电子设备和介质在审
申请号: | 202210974444.X | 申请日: | 2022-08-15 |
公开(公告)号: | CN115346520A | 公开(公告)日: | 2022-11-15 |
发明(设计)人: | 陈金坤;侯俊峰;李婉瑜;张骏;马泽君 | 申请(专利权)人: | 北京有竹居网络技术有限公司 |
主分类号: | G10L15/18 | 分类号: | G10L15/18;G10L15/183;G10L15/26 |
代理公司: | 北京市金杜律师事务所 11256 | 代理人: | 邓雪萌 |
地址: | 101299 北京市平*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 语音 识别 方法 装置 电子设备 介质 | ||
本公开的实施例涉及语音识别的方法、装置、电子设备和介质。该方法包括获取流式语音的声学表示和流式语音的已识别部分的语义表示。该方法还包括获取流式语音的对话上下文。该方法还包括基于声学表示、流式语音的已识别部分的语义表示和对话上下文,生成流式语音的识别结果。通过本公开的实施例能够使得语音识别的准确度更高。
技术领域
本公开的实施例涉及计算机领域,并且更具体地,涉及语音识别的方法、装置、电子设备和介质。
背景技术
语音识别是指对说出的语音进行识别,并将其转换成对应文字的技术。随着自然语言处理技术的发展,已经具有对以流式传输方式接收的语音进行识别的技术。在以流式传输方式接收的语音中,语音识别模型无法感知到用户在下文所说的内容,只能知道当前语句的历史信息,因此识别的难度较大,导致识别率较差。
发明内容
本公开的实施例提供了一种语音识别的方法、装置、电子设备和计算机可读存储介质。
根据本公开的第一方面,提供了一种语音识别的方法。该方法包括获取流式语音的声学表示和流式语音的已识别部分的语义表示。该方法还包括获取流式语音的对话上下文。该方法还包括基于声学表示、流式语音的已识别部分的语义表示和对话上下文,生成流式语音的识别结果。
在本公开的第二方面中,提供了一种语音识别的装置。该装置包括语音获取模块,被配置为获取流式语音的声学表示和流式语音的已识别部分的语义表示。该装置还包括上下文获取模块,被配置为获取流式语音的对话上下文。该装置还包括识别结果生成模块,被配置为基于声学表示、流式语音的已识别部分的语义表示和对话上下文,生成流式语音的识别结果。
根据本公开的第三方面,提供了一种电子设备。该电子设备包括处理器以及与处理器耦合的存储器,存储器具有存储于其中的指令,指令在被处理器执行时使电子设备执行根据第一方面所述的方法。
在本公开的第四方面中,提供了一种计算机可读存储介质。该计算机可读存储介质上存储有一条或多条计算机指令,其中一条或多条计算机指令被处理器执行以实现根据第一方面所述的方法。
提供发明内容部分是为了以简化的形式来介绍对概念的选择,它们在下文的具体实施方式中将被进一步描述。发明内容部分无意标识要求保护的主题的关键特征或主要特征,也无意限制要求保护的主题的范围。
附图说明
结合附图并参考以下详细说明,本公开各实施例的上述和其它特征、优点及方面将变得更加明显。在附图中,相同或相似的附图标记表示相同或相似的元素,其中:
图1示出了根据本公开的某些实施例的语音识别方法能够在其中实现的示例环境的示意图;
图2示出了根据本公开的某些实施例的语音识别方法的流程图;
图3示出了根据本公开的一个实施例的语音识别的过程的示意图;
图4示出了根据本公开的另一个实施例的语音识别的过程的示意图;
图5示出了根据本公开的某些实施例的确定语义关联表示的过程的示意图;
图6示出了根据本公开的某些实施例的用于语音识别的装置的框图;以及
图7示出了根据本公开的某些实施例的用于语音识别的设备的框图。
在所有附图中,相同或相似参考数字表示相同或相似元素。
具体实施方式
可以理解的是,在使用本公开各实施例公开的技术方案之前,均应当依据相关法律法规通过恰当的方式对本公开所涉及个人信息的类型、使用范围、使用场景等告知用户并获得用户的授权。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京有竹居网络技术有限公司,未经北京有竹居网络技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210974444.X/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种执行机构的冷却装置
- 下一篇:一种新能源汽车液冷板内部冲刷腐蚀实验装置