[发明专利]基于短时离散谐波变换的音色特征提取方法在审
申请号: | 201910881274.9 | 申请日: | 2019-09-18 |
公开(公告)号: | CN110570878A | 公开(公告)日: | 2019-12-13 |
发明(设计)人: | 李海峰;孙聪珊;杨婧;马琳;李洪伟;陈婧;薄洪健;丰上;熊文静 | 申请(专利权)人: | 哈尔滨工业大学 |
主分类号: | G10L25/18 | 分类号: | G10L25/18 |
代理公司: | 51241 成都方圆聿联专利代理事务所(普通合伙) | 代理人: | 李鹏 |
地址: | 150001 黑龙*** | 国省代码: | 黑龙;23 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开了一种基于短时离散谐波变换的音色特征提取方法,包括:用基于三电平中心削波互相关函数法提取基音周期估计值,并基于基音周期获得对音频信号的谐波结构信息进行提取的频域变换方法,进一步提取谐波结构信息,构建音色谐波谱特征,用于对音频音色特征的提取。本发明的优点是:可以解决现有技术中对音频谐波结构信息提取不足,且使用的相关音色特征数目庞大,信息冗余,效率低下的问题,获得具有稀疏性的音频谐波结构信息提取方法。 | ||
搜索关键词: | 谐波结构 音色特征 信息提取 基音周期估计 互相关函数 基音周期 离散谐波 频域变换 信息冗余 音频信号 中心削波 三电平 稀疏性 谐波谱 构建 音色 | ||
【主权项】:
1.一种基于短时离散谐波变换的音色特征提取方法,其特征在于:包括:短时离散谐波变换方法和音色谐波谱特征提取方法;/na.短时离散谐波变换方法/n基于谐波结构理论,根据音源的物理特性:物体振动发出的音频是复音,即具有谐波结构,且每个复音均有一个基频f
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于哈尔滨工业大学,未经哈尔滨工业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201910881274.9/,转载请声明来源钻瓜专利网。
- 同类专利
- 基于语义分割编解码网络的声学场景分类方法-201910822432.3
- 马欣欣;马勇;顾明亮 - 江苏师范大学
- 2019-09-02 - 2020-01-21 - G10L25/18
- 本发明公开了一种基于语义分割编解码网络的声学场景分类方法,包括如下步骤:S10,分别提取待识别音频数据的梅尔声谱图和标准声谱图;S20,在分别对所述梅尔声谱图和所述标准声谱图进行归一化处理后,将归一化处理后的梅尔声谱图和标准声谱图进行融合处理,得到融合特征;S30,将所述融合特征分别输入SegNet声学模型和UNet声学模型;S40、获取所述SegNet声学模型的第一输出结果以及所述UNet声学模型的第二输出结果,根据所述第一输出结果和第二输出结果确定所述第二输出结果中各个单元音频的声学场景。采用本方法能够使待识别音频数据中的各个单元音频均准确地确定相应声学场景,可以提高声学场景的识别性能。
- 用于识别应用的使用场景的方法和装置-201810538486.2
- 朱唯鑫;李超;孙建伟;文铭 - 百度在线网络技术(北京)有限公司
- 2018-05-30 - 2020-01-21 - G10L25/18
- 本申请实施例公开了用于识别应用的使用场景的方法和装置。该方法的一具体实施方式包括:响应于检测到目标应用的归属于预设类别的子应用被运行,对周围环境中的语音信息进行采集;对采集到的语音信息进行特征提取,将提取出的特征信息输入预先训练的场景识别模型,得到识别结果,其中,识别结果包括语音信息是在预设场景下采集的概率,场景识别模型用于表征特征信息与识别结果之间的对应关系;基于该概率,确定目标应用当前的使用场景是否为预设场景。该实施方式实现了对目标应用当前的使用场景的识别。
- 一种音频处理方法、设备及具有存储功能的装置-201910673556.X
- 郑占磊;熊磊 - 安克创新科技股份有限公司
- 2019-07-24 - 2019-12-17 - G10L25/18
- 本申请公开了音频处理方法、设备及具有存储功能的装置,该方法包括:获取音频文件;对音频文件进行频谱分析得到至少一个频谱特征,以在音频文件中识别出至少一个频谱特征对应的预设音频信号;对预设音频信号进行与其频谱特征相匹配的处理,以实现预设音频信号的增强或削弱。通过上述方式,本申请能够保持音质同时提高声音真实度。
- 基于短时离散谐波变换的音色特征提取方法-201910881274.9
- 李海峰;孙聪珊;杨婧;马琳;李洪伟;陈婧;薄洪健;丰上;熊文静 - 哈尔滨工业大学
- 2019-09-18 - 2019-12-13 - G10L25/18
- 本发明公开了一种基于短时离散谐波变换的音色特征提取方法,包括:用基于三电平中心削波互相关函数法提取基音周期估计值,并基于基音周期获得对音频信号的谐波结构信息进行提取的频域变换方法,进一步提取谐波结构信息,构建音色谐波谱特征,用于对音频音色特征的提取。本发明的优点是:可以解决现有技术中对音频谐波结构信息提取不足,且使用的相关音色特征数目庞大,信息冗余,效率低下的问题,获得具有稀疏性的音频谐波结构信息提取方法。
- 音频信号的信号提取方法与装置-201510381774.8
- 许宗奇 - 联咏科技股份有限公司
- 2015-07-02 - 2019-12-10 - G10L25/18
- 一种音频信号的信号提取方法与装置。转换音频信号为多个音频帧,其中上述多个音频帧依时间顺序排列。获得各音频帧的频谱数据。依时间顺序取出N个音频帧各自的频谱数据,并且对上述N个音频帧执行频谱相连性运算。最后,将各音频帧中与相邻音频帧之间具有频谱相连性的信号判定为理想信号。
- 一种基于边云智能架构的异常声音检测方法-201910304245.6
- 杨树森;张红;惠永昌 - 江苏慧中数据科技有限公司
- 2019-04-16 - 2019-12-06 - G10L25/18
- 一种基于边云智能架构的异常声音检测方法,包括以下步骤:在边缘端收集音频数据,将边缘端可以处理的任务尽可能部署到边缘设备执行,云端使用Docker容器技术对任务处理算子进行封装实现计算任务的迁移并存储音频检测结果,使用深度神经网络模型进行异常声音判断,通过MQTT协议在不同设备之间进行消息通信;缓解了云计算中心和网络带宽的压力,提高了系统的实时性和响应能力,同时使得数据的安全性得到了更好的保护。
- 一种音频信号分类方法和装置-201610867997.X
- 王喆 - 华为技术有限公司
- 2013-08-06 - 2019-11-19 - G10L25/18
- 本发明实施例公开了一种音频信号分类方法和装置,用于对输入的音频信号进行分类,该方法包括:根据当前音频帧的声音活动性,确定是否获得当前音频帧的频谱波动并存储于频谱波动存储器中,其中,所述频谱波动表示音频信号的频谱的能量波动;根据音频帧是否为敲击音乐或历史音频帧的活动性,更新频谱波动存储器中存储的频谱波动;根据频谱波动存储器中存储的频谱波动的部分或全部有效数据的统计量,将所述当前音频帧分类为语音帧或者音乐帧。
- 基于性别预判与多频段参数映射的语音基音频率估计方法-201510489027.6
- 黄程韦;于拾全;朱晓明 - 东莞市凡豆信息科技有限公司
- 2015-08-11 - 2019-11-15 - G10L25/18
- 本发明公开了一种基于性别预判与多频段参数映射的语音基音频率估计方法,涉及语音信号处理方法技术领域。所述方法包括如下步骤:1)采用判决反馈的方式进行语音基音频率的估计,对发音人的性别进行判断;2)根据发音人性别的判断结果进行参数的优化;3)对优化后的参数采用迭代循环的方式,进行参数预测和频率重估,得到语音基音频率。所述方法具有计算量小,精度高的优点。
- 专利分类