[发明专利]一种方言语音识别方法和装置在审
申请号: | 202210588274.1 | 申请日: | 2022-05-27 |
公开(公告)号: | CN115019771A | 公开(公告)日: | 2022-09-06 |
发明(设计)人: | 张海峰;王碧琳;温海星 | 申请(专利权)人: | 中国银行股份有限公司 |
主分类号: | G10L15/00 | 分类号: | G10L15/00;G10L15/02 |
代理公司: | 北京三友知识产权代理有限公司 11127 | 代理人: | 王天尧;陶海萍 |
地址: | 100818 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 方言 语音 识别 方法 装置 | ||
本发明提供了一种方言语音识别方法和装置,属于人工智能,该方法包括:对采集的初始方言语音进行预处理,确定规范方言语音;提取规范方言语音的语音特征,结合方言的音素信息构成语音发音底层特征;对语音发音底层特征提取局部特征,抽取每一帧语音与其他帧的关系,将音素映射至设定维度,确定方言识别结果。本发明实施例可以提高手机银行在方言语音识别方面的准确率。
技术领域
本发明涉及语音识别技术领域,尤其涉及一种方言语音识别方法和装置。
背景技术
本部分旨在为权利要求书中陈述的本发明的实施方式提供背景或上下文。此处的描述不因为包括在本部分中就承认是现有技术。
随着大数据及人工智能技术的飞速发展,机器学习等深度学习方法逐渐成熟,且已被广泛应用在多个领域,如在手机银行中快速检索中的语音识别等等。
在面向老年客户群体及带方言口音的客户群体时,目前实现的语音识别方案在识别方言方面准确率较低,使得客户体验效果不佳。
因此,如何提供一种新的方案,其能够解决上述技术问题是本领域亟待解决的技术难题。
发明内容
本发明实施例提供一种方言语音识别方法,可以提高手机银行在方言语音识别方面的准确率,该方法包括:
对采集的初始方言语音进行预处理,确定规范方言语音;
提取规范方言语音的语音特征,结合方言的音素信息构成语音发音底层特征;
对语音发音底层特征提取局部特征,抽取每一帧语音与其他帧的关系,将音素映射至设定维度,确定方言识别结果。
本发明实施例还提供一种方言语音识别装置,包括:
预处理模块,用于对采集的初始方言语音进行预处理,确定规范方言语音;
特征提取模块,用于提取规范方言语音的语音特征,结合方言的音素信息构成语音发音底层特征;
语音识别模块,用于对语音发音底层特征提取局部特征,抽取每一帧语音与其他帧的关系,将音素映射至设定维度,确定方言识别结果。
本发明实施例还提供一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现上述一种方言语音识别方法。
本发明实施例还提供一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行时实现上述一种方言语音识别方法。
本发明实施例还提供一种计算机程序产品,所述计算机程序产品包括计算机程序,所述计算机程序被处理器执行时实现上述一种方言语音识别方法。
本发明实施例提供的一种方言语音识别方法和装置,包括:对采集的初始方言语音进行预处理,确定规范方言语音;提取规范方言语音的语音特征,结合方言的音素信息构成语音发音底层特征;对语音发音底层特征提取局部特征,抽取每一帧语音与其他帧的关系,将音素映射至设定维度,确定方言识别结果。本发明实施例可以提高手机银行在方言语音识别方面的准确率,有效降低了语音特征提取的不足,提取不同方言的音素信息构成的语音发音底层特征,利用该方言发音底层特征进行方言语音的识别,提升对方言语音的正确识别率,使方言用户可以正常使用相关功能,提升客户体验效果。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。在附图中:
图1为本发明实施例一种方言语音识别方法示意图。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国银行股份有限公司,未经中国银行股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210588274.1/2.html,转载请声明来源钻瓜专利网。