[发明专利]语音识别方法、装置、设备及存储介质在审
申请号: | 202111347046.7 | 申请日: | 2021-11-15 |
公开(公告)号: | CN114155841A | 公开(公告)日: | 2022-03-08 |
发明(设计)人: | 王玮;杨玲;苏文畅;国丽;李沫 | 申请(专利权)人: | 安徽听见科技有限公司 |
主分类号: | G10L15/06 | 分类号: | G10L15/06;G10L15/16;G10L15/24;G10L15/26;G06F40/186;G06F40/279;G06N3/04;G06N3/08 |
代理公司: | 北京集佳知识产权代理有限公司 11227 | 代理人: | 鲁梅 |
地址: | 230088 安徽省合肥市高新区习*** | 国省代码: | 安徽;34 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 语音 识别 方法 装置 设备 存储 介质 | ||
本申请提出一种语音识别方法、装置、设备及存储介质,该方法包括:获取生成待识别语音的语音场景的属性信息,和/或,确定生成待识别语音的语音场景中的人员的属性信息;根据所述语音场景的属性信息和/或所述语音场景中的人员的属性信息,确定对所述待识别语音的语音识别结果。采用上述的语音识别方法,能够保证识别结果与语音场景相匹配,从而能够使语音识别胜任对任意语音场景中的语音的识别,在任意的语音场景中,都能够得到更准确的语音识别结果。
技术领域
本申请涉及语音识别技术领域,尤其涉及一种语音识别方法、装置、设备及存储介质。
背景技术
随着语音识别技术的发展,语音识别在会议、演讲等语音场景中的应用越来越广泛。借助语音识别技术,可以对语音场景中生成的语音音频进行自动识别,并生成相应的识别文本,从而为用户记录语音内容提供极大便利。例如在会议场景中,借助语音识别技术对会议发言人的语音进行识别,可以实现自动记录发言人发言内容的目的,由此可以方便用户记录会议内容,不仅能够提高记录效率,还能减轻参会用户的听写压力。
常规的语音识别方法是通过对语音音频数据进行处理,确定语音音频对应的文本内容,从而达到语音识别的目的。但是在实际应用中,不同语音场景中生成的语音音频具备其独特的特点,采用常规的语音识别方法往往无法胜任对各种语音场景的语音的准确识别。
发明内容
基于上述技术现状,本申请提出一种语音识别方法、装置、设备及存储介质,该语音识别方法能够保证识别出的语音识别结果与语音场景相匹配,得到更准确的语音识别结果。
为了达到上述目的,本申请提出如下技术方案:
一种语音识别方法,包括:
获取生成待识别语音的语音场景的属性信息,和/或,确定生成待识别语音的语音场景中的人员的属性信息;
根据所述语音场景的属性信息和/或所述语音场景中的人员的属性信息,确定对所述待识别语音的语音识别结果。
可选的,所述根据所述语音场景的属性信息和/或所述语音场景中的人员的属性信息,确定对所述待识别语音的语音识别结果,包括:
对所述待识别语音进行语音识别,得到语音识别结果;
根据所述语音场景的属性信息和/或所述语音场景中的人员的属性信息,对所述语音识别结果进行校正,得到所述待识别语音的校正后的语音识别结果。
可选的,所述获取生成待识别语音的语音场景的属性信息,包括:
获取生成待识别语音的语音场景的场景图像,和/或,获取生成待识别语音的语音场景中的语音数据;
通过对所述场景图像进行图像识别,和/或,通过对所述语音数据进行语音识别,确定所述语音场景的属性信息。
可选的,通过对所述场景图像进行图像识别,确定所述语音场景的属性信息,包括:
识别所述场景图像中的文本内容;
根据从所述场景图像中识别出的文本内容,确定所述语音场景的场景属性信息,所述场景属性信息包括所述语音场景的区域、领域、人员信息中的至少一种。
可选的,通过对所述场景图像进行图像识别,确定所述语音场景的属性信息,还包括:
根据所述场景图像,识别所述语音场景的场景类型。
可选的,通过对所述语音数据进行语音识别,确定所述语音场景的属性信息,包括:
对所述语音数据进行语音识别,得到与所述语音数据对应的文本内容;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于安徽听见科技有限公司,未经安徽听见科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111347046.7/2.html,转载请声明来源钻瓜专利网。