[发明专利]一种语音去重方法、装置、服务器及存储介质有效
申请号: | 201810724991.6 | 申请日: | 2018-07-04 |
公开(公告)号: | CN108847251B | 公开(公告)日: | 2022-12-02 |
发明(设计)人: | 杨小龙;张文明;陈少杰 | 申请(专利权)人: | 武汉斗鱼网络科技有限公司 |
主分类号: | G10L25/24 | 分类号: | G10L25/24;G10L25/27;G10L25/48;G06K9/62 |
代理公司: | 北京品源专利代理有限公司 11332 | 代理人: | 孟金喆 |
地址: | 430070 湖北省武汉市武汉东湖*** | 国省代码: | 湖北;42 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明实施例公开了一种语音去重方法、装置、服务器和存储介质,其中,语音去重方法包括:利用梅尔频率倒谱系数MFCC算法获取目标短语音的MFCC特征矩阵,并将MFCC特征矩阵转换为目标图像;基于深度学习模型和特征降维算法,提取目标图像的目标图像特征,并确定目标图像特征的目标索引;根据目标索引确定与各历史短语音相对应的各历史图像特征,利用各历史图像特征与目标图像特征之间的重复度,确定目标短语音是否为重复语音。本发明实施例克服了现有语音去重方法忽视了语音内容的深层信息,仅能对内容相似的两份语音进行粗略的评定的不足,并基于语音内容的层面,实现了快速有效地对语音数据进行去重处理。 | ||
搜索关键词: | 一种 语音 方法 装置 服务器 存储 介质 | ||
【主权项】:
1.一种语音去重方法,其特征在于,包括:利用梅尔频率倒谱系数MFCC算法获取目标短语音的MFCC特征矩阵,并将所述MFCC特征矩阵转换为目标图像;基于深度学习模型和特征降维算法,提取所述目标图像的目标图像特征,并确定所述目标图像特征的目标索引;根据所述目标索引确定与各历史短语音相对应的各历史图像特征,利用所述各历史图像特征与所述目标图像特征之间的重复度,确定所述目标短语音是否为重复语音。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于武汉斗鱼网络科技有限公司,未经武汉斗鱼网络科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201810724991.6/,转载请声明来源钻瓜专利网。