[发明专利]一种婴儿语音基频高精度提取方法、装置及计算机设备有效
申请号: | 202110487291.1 | 申请日: | 2021-05-05 |
公开(公告)号: | CN113205827B | 公开(公告)日: | 2022-02-15 |
发明(设计)人: | 张茜 | 申请(专利权)人: | 张茜 |
主分类号: | G10L21/0308 | 分类号: | G10L21/0308;G10L25/03 |
代理公司: | 深圳国海智峰知识产权代理事务所(普通合伙) 44489 | 代理人: | 刘军锋 |
地址: | 561299 贵州省安顺*** | 国省代码: | 贵州;52 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 婴儿 语音 基频 高精度 提取 方法 装置 计算机 设备 | ||
本发明涉及婴儿语音基频高精度提取方法、装置,包括获取婴儿语音数据,按照预设语音分帧处理策略对婴儿语音数据进行分帧处理,获得若干帧时域上的分帧婴儿语音数据;将时域上的分帧婴儿语音数据进行快速傅里叶变换后取绝对值,获得频域上的分帧婴儿语音数据;将频域上的分帧婴儿语音数据划分为对称的第一部分及第二部分,将第一部分或第二部分定义为数组Z,根据预设计算策略对数组Z取对数,记为Zlog;计算Zlog的自相关系数,根据Zlog的自相关系数获取婴儿语音数据的语音基频。本发明提供的婴儿语音基频高精度提取方法、装置,将婴儿语音数据进行分帧、转换为频域,取对数之后进行自相关系数计算,从而大大提高计算精度。
技术领域
本发明涉及语音基频检测提取领域,尤其涉及一种婴儿语音基频高精度提取方法、装置及计算机设备。
背景技术
目前人声的语音处理大部分是针对已经会说话的人群。一般侧重于说话人识别和语音识别,对婴儿这类倾向于情感表现而无对应文字的啼哭音研究太少。通用的基频识别方法包括自相关系数法、平均幅值差函数法、倒谱系数法等,但是倒谱系数法对资源要求过大。由于婴儿的基音频率较高,谐音个数少,有时第一共振峰过高,基音频率衰减过大,因而使用自相关系数法、平均幅值差函数法对于婴儿基频进行识别时容易出错。
发明内容
针对上述问题,本发明提供一种婴儿语音基频高精度提取方法,方法包括:获取婴儿语音数据,按照预设语音分帧处理策略对婴儿语音数据进行分帧处理,获得若干帧时域上的分帧婴儿语音数据;将时域上的分帧婴儿语音数据进行快速傅里叶变换后取绝对值,获得频域上的分帧婴儿语音数据;将频域上的分帧婴儿语音数据从中间位置处划分为对称的第一部分及第二部分,将第一部分或所述第二部分定义为数组Z,根据预设计算策略对所述数组Z取对数,记为Zlog;根据预设的自相关系数计算策略计算Zlog的自相关系数,根据Zlog的自相关系数以及预设的语音基频提取策略提取婴儿语音数据的语音基频。
进一步的,按照预设语音分帧处理策略对婴儿语音数据进行分帧处理包括:对婴儿语音数据进行预加重处理,提高婴儿语音数据的高频分辨率;将进行预加重处理后的婴儿语音数据,利用汉明窗进行分帧处理。
进一步的,在将分帧婴儿语音数据进行快速傅里叶变换后取绝对值,获得频域上的分帧婴儿语音数据前,方法还包括:预先计算分帧婴儿语音数据中的各个数据分度的正弦值以及余弦值,并将各个数据分度的正弦值以及余弦值存为数组,在将分帧婴儿语音数据进行快速傅里叶变换时,利用数组进行快速傅里叶变换。
进一步的,每一帧分帧婴儿语音数据的采样频率为8820Hz,采样点为256个。
进一步的,根据预设计算策略对数组Z取对数,记为Zlog包括:预先存储m=1024:128:33664的自然对数结果n,其中m=1024:128:33664为m从1024开始,以128为步进,至33664结束的256个数据,依次表示为m0、m1、m2……m255,m0、m1、m2……m255的自然对数结果依次表示为n0、n1、n2……n255;利用公式ln(Z)=ln(Z*et)-t,对ln(Z)进行变形,令Z’=Z*et,Z’在[m0,m255]区间内;确定Z’所在的精确区间[mq,mq+1],q为[0,255]中的整数;获取mq的自然对数结果nq,根据公式ln(Z’)=nq+(Z’-mq)/mq以及公式ln(Z)=ln(Z’)-t,计算得到ln(Z)作为将数组Z取对数的结果Zlog。
进一步的,将时域上的分帧婴儿语音数据进行快速傅里叶变换后取绝对值为利用牛顿迭代法计算绝对值。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于张茜,未经张茜许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110487291.1/2.html,转载请声明来源钻瓜专利网。