[发明专利]一种通过关键字定位话机录音位置的方法和装置在审
申请号: | 202210632639.6 | 申请日: | 2022-06-06 |
公开(公告)号: | CN115103067A | 公开(公告)日: | 2022-09-23 |
发明(设计)人: | 林唐林 | 申请(专利权)人: | 上海华信长安网络科技有限公司 |
主分类号: | H04M3/42 | 分类号: | H04M3/42;H04M3/493;H04M7/00;G10L15/02;G10L15/12;G10L15/26 |
代理公司: | 上海嘉蓝专利代理事务所(普通合伙) 31407 | 代理人: | 周晶晶 |
地址: | 200000 上海市嘉定区安*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 通过 关键字 定位 话机 录音 位置 方法 装置 | ||
1.一种通过关键字定位话机录音位置的方法,其特征在于,该方法包括:
S01:话机保存通话录音;
S02:应用程序对保存的录音进行预处理;
S03:应用程序利用MFCC算法对预处理后的录音进行特征参数提取,把提取出的特征参数转化为特征向量组并将提特征向量组建立成参考模板;
S04:管理员输入查询关键词,应用程序使用DTW算法将关键词与参考模板匹配,识别关键词并将录音跳转至关键词的位置。
2.根据权利要求1所述的一种通过关键字定位话机录音位置的方法,其特征在于,S02所述的预处理包括:预加重、分帧、加窗及端点检测。
3.根据权利要求2所述的一种通过关键字定位话机录音位置的方法,其特征在于,所述的分帧采用前后帧交叠的方法,即帧移小于帧长的一半。
4.根据权利要求2所述的一种通过关键字定位话机录音位置的方法,其特征在于,所述的端点检测的方法包括短时能量门限检测法及短时过零率检测法;
所述短时能量门限检测法的表达式为:其中N为语音信号的帧长,xn(m)为第n帧的加窗语音信号,E为该帧的短时能量值;
所述短时过零率检测法的表达式为:其中,sgn[]是符号函数
5.根据权利要求2所述的一种通过关键字定位话机录音位置的方法,其特征在于,所述的加窗指的是对分帧的截断处进行平滑处理,加窗的方法包括:矩形窗、海明窗、汉宁窗、三角窗和高斯窗。
6.根据权利要求1所述的一种通过关键字定位话机录音位置的方法,其特征在于,S03中所述的MFCC算法的计算公式为:其中fm表示对应的梅尔频度,f表示频度。
7.根据权利要求1所述的一种通过关键字定位话机录音位置的方法,其特征在于,S04中所述的DTW算法的思路为:应用程序把输入的关键词转换成关键词特征向量组,再将此关键词特征向量组与参考模板匹配,计算出关键词特征向量组与参考模板中的特征向量组之间的距离,距离最短的一组为相似度最高的一组,则此特征向量组对应的词句为识别结果;
DTW算法的计算式为:其中D为最优时间规整情况下的两组矢量之间的累积距离,d[T(n),R(ω(n))为第n帧测试语音矢量T(n)和第m帧模板语音矢量R(m)之间的距离。
8.一种通过关键字定位话机录音位置的装置,其特征在于,该装置包括:
保存模块:用于话机保存通话录音;
预处理模块:用于应用程序对保存的录音进行预处理;
特征参数提取模块:用于应用程序利用MFCC算法对预处理后的录音进行特征参数提取,把提取出的特征参数转化为特征向量组并将提特征向量组建立成参考模板;
识别模块:用于管理员输入查询关键词,应用程序使用DTW算法将关键词与参考模板匹配,识别关键词并将录音跳转至关键词的位置。
9.根据权利要求8所述的一种通过关键字定位话机录音位置的装置,其特征在于,预处理模块中所述的预处理包括:预加重、分帧、加窗及端点检测。
10.根据权利要求9所述的一种通过关键字定位话机录音位置的装置,其特征在于,所述的分帧采用前后帧交叠的方法,即帧移小于帧长的一半。
11.根据权利要求9所述的一种通过关键字定位话机录音位置的装置,其特征在于,所述的加窗指的是对分帧的截断处进行平滑处理,加窗的方法包括:矩形窗、海明窗、汉宁窗、三角窗和高斯窗。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海华信长安网络科技有限公司,未经上海华信长安网络科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210632639.6/1.html,转载请声明来源钻瓜专利网。