[发明专利]一种婴儿语音基频高精度提取方法、装置及计算机设备有效
申请号: | 202110487291.1 | 申请日: | 2021-05-05 |
公开(公告)号: | CN113205827B | 公开(公告)日: | 2022-02-15 |
发明(设计)人: | 张茜 | 申请(专利权)人: | 张茜 |
主分类号: | G10L21/0308 | 分类号: | G10L21/0308;G10L25/03 |
代理公司: | 深圳国海智峰知识产权代理事务所(普通合伙) 44489 | 代理人: | 刘军锋 |
地址: | 561299 贵州省安顺*** | 国省代码: | 贵州;52 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 婴儿 语音 基频 高精度 提取 方法 装置 计算机 设备 | ||
1.一种婴儿语音基频高精度提取方法,其特征在于,所述方法包括:
获取婴儿语音数据,按照预设语音分帧处理策略对所述婴儿语音数据进行分帧处理,获得若干帧时域上的分帧婴儿语音数据;
将所述时域上的分帧婴儿语音数据进行快速傅里叶变换后取绝对值,获得频域上的分帧婴儿语音数据;
将所述频域上的分帧婴儿语音数据从中间位置处划分为对称的第一部分及第二部分,其中,第一部分为频域上的分帧婴儿语音数据的前半部分序列,第二部分为频域上的分帧婴儿语音数据的后半部分序列,将所述第一部分或所述第二部分定义为数组Z,根据预设计算策略对所述数组Z取对数,记为Zlog;
根据预设的自相关系数计算策略计算所述Zlog的自相关系数,根据所述Zlog的自相关系数获得自相关系数-频率图谱,根据所述自相关系数-频率图谱中的谐波间距提取所述婴儿语音数据的语音基频。
2.根据权利要求1所述的婴儿语音基频高精度提取方法,其特征在于,所述按照预设语音分帧处理策略对所述婴儿语音数据进行分帧处理包括:
对所述婴儿语音数据进行预加重处理,提高所述婴儿语音数据的高频分辨率;
将进行预加重处理后的所述婴儿语音数据,利用汉明窗进行分帧处理。
3.根据权利要求1所述的婴儿语音基频高精度提取方法,其特征在于,在将所述分帧婴儿语音数据进行快速傅里叶变换后取绝对值,获得频域上的分帧婴儿语音数据前,所述方法还包括:
预先计算所述分帧婴儿语音数据中的各个数据分度的正弦值以及余弦值,并将各个数据分度的正弦值以及余弦值存为数组,在将所述分帧婴儿语音数据进行快速傅里叶变换时,利用所述数组进行快速傅里叶变换。
4.根据权利要求1所述的婴儿语音基频高精度提取方法,其特征在于,每一帧分帧婴儿语音数据的采样频率为8820Hz,采样点为256个。
5.根据权利要求4所述的婴儿语音基频高精度提取方法,其特征在于,所述根据预设计算策略对所述数组Z取对数,记为Zlog包括:
预先存储m=1024:128:33664的自然对数结果n,其中m=1024:128:33664为m从1024开始,以128为步进,至33664结束的256个数据,依次表示为m0、m1、m2……m255,m0、m1、m2……m255的自然对数结果依次表示为n0、n1、n2……n255;
利用公式ln(Z)=ln(Z*et)-t,对ln(Z)进行变形,令Z’=Z*et,Z’在[m0,m255]区间内,t为整数;
确定Z’所在的精确区间[mq,mq+1],q为[0,255]中的整数;
获取mq的自然对数结果nq,根据公式ln(Z’)=nq+(Z’-mq)/mq以及公式ln(Z)=ln(Z’)-t,计算得到ln(Z)作为将所述数组Z取对数的结果Zlog。
6.根据权利要求1所述的婴儿语音基频高精度提取方法,其特征在于,所述将所述时域上的分帧婴儿语音数据进行快速傅里叶变换后取绝对值为利用牛顿迭代法计算绝对值。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于张茜,未经张茜许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110487291.1/1.html,转载请声明来源钻瓜专利网。