[发明专利]一种语音处理方法及装置有效

申请号：	202110366094.4	申请日：	2021-04-06
公开（公告）号：	CN113192488B	公开（公告）日：	2022-05-06
发明（设计）人：	李程帅;孙进伟;徐涛	申请（专利权）人：	青岛信芯微电子科技股份有限公司
主分类号：	G10L15/02	分类号：	G10L15/02;G06K9/62;G10L15/20;G10L15/22
代理公司：	北京同达信恒知识产权代理有限公司 11291	代理人：	彭燕
地址：	266100 山***	国省代码：	山东;37
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	一种语音处理方法装置
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【说明书】：

本发明实施例涉及语音处理技术领域，尤其涉及一种语音处理方法、装置、计算设备及计算机可读存储介质。包括：针对语音集中的任一第一语音文件，通过语音分析确定第一语音文件的第一有效语音；对各第一有效语音在各第一语音文件中的位置进行聚类，得到有效语音在语音文件中的k个预测位置；针对语音集中的任一第二语音文件，从第二语音文件在k个预测位置处的语音序列中，确定第二语音文件的第二有效语音。通过先对语音集中的一部分语音文件的有效语音所在的位置进行聚类，得到k个可能的预测位置，如此，针对剩下的语音文件，只需在这k个预测位置处进行判断即可，无需对再进行逐帧的语音分析，从而提高了提取有效语音的效率。

技术领域

本发明实施例涉及语音处理技术领域，尤其涉及一种语音处理方法、装置、计算设备及计算机可读存储介质。

背景技术

为了训练基于深度学习的语音识别声学模型，通常需要对大量的语音数据进行处理，其数据量是几十万甚至上百万的。在对语音处理的过程中，往往需要提取每个文件的有效语音，但是由于数据量巨大，提取有效语音的效率就极为重要。

综上，目前亟需一种语音处理方法，用以解决现有的提取有效语音的工作量大，效率低的问题。

发明内容

本发明实施例提供一种语音处理方法，用以解决现有的提取有效语音的工作量大，效率低的问题。

本发明实施例提供一种语音处理方法，包括：

针对语音集中的任一第一语音文件，通过语音分析确定所述第一语音文件的第一有效语音；

对各第一有效语音在各第一语音文件中的位置进行聚类，得到有效语音在语音文件中的k个预测位置；

针对所述语音集中的任一第二语音文件，从所述第二语音文件在所述k个预测位置处的语音序列中，确定所述第二语音文件的第二有效语音。

通过先对语音集中的一部分语音文件判断其对应的有效语音，然后通过对这一部分的有效语音所在的位置进行聚类，从而得到k个可能的预测位置，如此，针对剩下的语音文件，只需在这k个预测位置处进行判断即可，而无需对剩下的语音文件再进行逐帧的语音分析，从而降低了工作量，提高了提取有效语音的效率。