[发明专利]检测基音周期的正确性的方法和装置有效

专利信息
申请号: 201210155298.4 申请日: 2012-05-18
公开(公告)号: CN103426441A 公开(公告)日: 2013-12-04
发明(设计)人: 齐峰岩;苗磊 申请(专利权)人: 华为技术有限公司
主分类号: G10L25/90 分类号: G10L25/90
代理公司: 北京龙双利达知识产权代理有限公司 11329 代理人: 王君;肖鹂
地址: 518129 广东*** 国省代码: 广东;44
权利要求书: 查看更多 说明书: 查看更多
摘要: 发明实施例提供了一种检测基音周期正确性的方法和装置。其中,检测基音周期正确性的方法,包括:依据输入信号在时域上的初始基音周期确定所述输入信号的基频点,其中初始基音周期是对所述输入信号进行开环检测得到;基于所述输入信号在频域上的幅度谱确定所述输入信号的与基频点关联的基音周期正确性判决参数;根据所述基音周期正确性判决参数确定所述初始基音周期的正确性。本发明实施例的检测基音周期的正确性的方法和装置能够基于复杂度较低的算法提升基音周期的正确性检测的准确度。
搜索关键词: 检测 基音 周期 正确性 方法 装置
【主权项】:
一种检测基音周期正确性的方法,其特征在于,包括:依据输入信号在时域上的初始基音周期确定所述输入信号的基频点,其中初始基音周期是对所述输入信号进行开环检测得到;基于所述输入信号在频域上的幅度谱确定所述输入信号的与基频点关联的基音周期正确性判决参数;根据所述基音周期正确性判决参数确定所述初始基音周期的正确性。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华为技术有限公司,未经华为技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/patent/201210155298.4/,转载请声明来源钻瓜专利网。

同类专利
  • 一种面向音频事件检测的双层基音特征提取方法-201610430195.2
  • 王健飞;张卫强 - 清华大学
  • 2016-06-16 - 2019-11-08 - G10L25/90
  • 本发明公开了属于音频事件检测技术领域的一种面向音频事件检测的双层基音特征提取方法。包括采集音频信号,将音频信号格式标准化:声音信号预处理和PITCH特征后处理,对只保留形状特征的PITCH,进行离散傅里叶变换DFT,得到长时域信号PITCH特征的频域特征,并取前面数个有效频域值;目前,通过对该双层基音特征的处理,可以有效提升对长时域周期性音频事件的检测。
  • 一种获取人声音高数据的方法和装置-201610487502.0
  • 张超钢 - 广州酷狗计算机科技有限公司
  • 2016-06-24 - 2019-10-08 - G10L25/90
  • 本发明公开了一种获取人声音高数据的方法和装置,属于计算机技术领域。所述方法包括:提取目标歌曲的原唱歌曲音频的人声音高数据,并分别提取所述目标歌曲的多个人声音频的人声音高数据;在所述多个人声音频的人声音高数据中,选取与所述原唱歌曲音频的人声音高数据匹配度最高的目标人声音高数据;基于所述目标人声音高数据,对所述原唱歌曲音频的人声音高数据中丢失的音高值进行补充,得到所述原唱歌曲音频的修正后的人声音高数据。采用本发明,可以提高获取的人声音高数据的准确度。
  • 一种测量音乐高音的装置-201920190306.6
  • 张鹭 - 贵州师范大学
  • 2019-02-11 - 2019-10-08 - G10L25/90
  • 本实用新型公开了一种测量音乐高音的装置,包括测音仪本体,所述测音仪本体通过夹紧机构连接有第一L型块,所述第一L型块通过第一调节机构连接有连接杆,所述连接杆通过第二调节机构连接有第二L型块,所述第二L型块的外侧壁固定连接有支撑杆。本实用新型中,通过底座、固定柱、支撑杆、限位块和第一把手螺丝的配合作用,达到了将测音仪本体固定在支撑装置上的效果,实现了不用人工手持测音仪本体对音乐音高进行测量的功能,便于减轻了工作人员的工作强度;通过U型块、伸缩杆、弹簧和夹紧板的配合作用,达到了弹簧支撑着两个夹紧板将测音仪本体固定在U型块上的效果,实现了便于对测音仪本体进行固定的功能。
  • 声乐学习电子辅助发音系统-201610562345.5
  • 秦赢;郭薇;刘恒博 - 黄河科技学院
  • 2016-07-15 - 2019-08-02 - G10L25/90
  • 本发明公开了一种声乐学习电子辅助发音系统,包括口型以及舌头位置图像采集模块,音频采集模块,数据处理模块,发音标准评估模块,口型标准评估模块,音高提取模块,节拍提取模块,音符音高和音符时值模型构建模块,演唱技能初级评估模块,综合评估模块,发音辅助指导模块,培训方案生成模块,中央处理器。本发明基于计算机系统完成了整个声乐技能检测过程中的数据的采集以及评估,自动化程度高,且涉及面广,可一次性完成喉头的位置及稳定性情况、声音的音色情况、音频穿透力情况、泛音运用情况以及吐字在发声中的保持情况的检测分析,从而可以得出针对性的培训方案。
  • 一种音调序列的鲁棒阶跃规整方法-201610231868.1
  • 李玉鑑;时康凯;杨红丽 - 北京工业大学
  • 2016-04-14 - 2019-06-14 - G10L25/90
  • 一种音调序列的鲁棒阶跃规整方法,用于将不准确的音调值规整到更符合上下文的音调值上,在音调值的确定上有很好的效果。具体过程包括:首选对输入音频数字信号提取原始音调序列,然后反复截取长度固定的子音调序列,并映射到规整矩阵中,其次扩展该规整矩阵,构造相应的图结构,求解其中的路径以生成路径关联矩阵,最后通过分析路径关联矩阵找到符合上下文的音调值作为音调校准值。本发明对音调序列规整的目标结果符合实际情况,对声音音调值的提取也更加准确可靠;对音调序列规整的过程可控,通过自行设定相关参数可以让规整的过程更加灵活;在音调序列值分散较大的情况仍然会有很好的效果,具备很好的鲁棒性。
  • 基于显著性的复调音乐主旋律提取方法-201610299427.5
  • 张维维;陈喆;殷福亮 - 大连民族大学
  • 2016-05-09 - 2019-06-11 - G10L25/90
  • 本发明公开一种基于显著性的复调音乐主旋律提取方法,是将相应的显著性函数定义为两谱峰幅度乘积,把同一帧中频率间距小于50音分范围的候选音高合并,可根据多种互质次谐波频率组合估计出音高;将相邻两帧频率间距小于50音分的候选音高连接构成音高轮廓线,并把长度小于50ms的音高轮廓初步筛除,根据设定筛选准则选择主旋律输出。即使在主旋律分量的基频缺失或被伴奏掩埋的情况下也能准确估计出主旋律分量的音高,根据设定筛选准则进行主旋律轮廓跟踪,进而获得正确的主旋律输出。
  • 基于粒子群优化的基音频率检测方法-201610064871.9
  • 张小恒 - 重庆工商职业学院
  • 2016-01-29 - 2019-03-12 - G10L25/90
  • 本发明提供一种极低信噪比环境下的基音频率检测方法。其特征在于利用PEFAC算法提取语音帧信号的特征波形,然后利用最佳优化因子对特征波形进行优化从而构造新的特征波形,最后找出特征波形最大峰值所对应的频率值作为基音频率的估计值,其中最佳优化因子依靠PSO算法搜索得到。
  • 一种显示人声音高数据的方法和装置-201610513225.6
  • 劳振锋;熊特 - 广州酷狗计算机科技有限公司
  • 2016-06-30 - 2018-08-03 - G10L25/90
  • 本发明公开了一种显示人声音高数据的方法和装置,属于计算机技术领域。所述方法包括:确定目标歌曲音频的人声音高数据中包括的各音高值;根据所述人声音高数据中包括的各音高值,以及预设的在界面中音高值的显示坐标范围,确定所述人声音高数据中每个音高值对应的显示坐标;基于所述人声音高数据中每个音高值对应的显示坐标,显示所述人声音高数据。采用本发明,可以更好的通过显示图像分辨音高值。
  • 音准抖动修正方法、装置、系统及音视频设备和移动终端-201310494727.5
  • 陈勇;刘旺 - 福建星网视易信息系统有限公司
  • 2013-10-21 - 2017-11-10 - G10L25/90
  • 本发明提供一种音准抖动修正方法,在屏幕上展示歌曲的基准音高值与演唱游标;录制用户演唱该歌曲的实时音频,并计算该实时音频的演唱音高值;判断该实时音频的演唱音高值与所述基准音高值是否一致,如果不一致,则通过降低当前时刻演唱音高值对应的坐标与前一时刻演唱游标的坐标或者与当前时刻标准音高值的坐标的差值对演唱音高值对应的坐标进行修正,并在修正位置上显示演唱游标,使得演唱游标的运动轨迹得到平滑展示;如果一致,则演唱游标直接显示在基准音高值所在的位置上。本发明还提供了一种音准抖动修正装置、系统及音视频设备和移动终端;其提高了演唱者音高与标准音高位置匹配的准确度,使得演唱者更容易观察到演唱游标。
  • 一种声乐学习电子辅助发音系统-201710127309.0
  • 武霄 - 河南职业技术学院
  • 2017-02-27 - 2017-06-27 - G10L25/90
  • 本发明公开了一种声乐学习电子辅助发音系统,包括音频采集模块、口型图像采集模块、喉头位置检测模块、特征信号采集模块、呼吸频率采集模块、数据处理模块、发音标准评估模块、口型标准评估模块、音高提取模块、节拍提取模块、音符音高和音符时值模型构建模块、初级评估模块、综合评估模块、发音辅助指导模块、培训方案生成模块和中央处理器。本发明基于计算机系统完成了整个发音情况检测过程中的数据的采集以及评估,自动化程度高,且涉及面广,可一次性完成喉头的位置及稳定性情况、声音的音色情况、音频穿透力情况、泛音运用情况以及吐字在发声中的保持情况、口型、音高、节拍的检测分析,可以得出针对性的培训方案,提高了学生的学习效率。
  • 语音基音频率检测方法和装置-201210427486.8
  • 吴晟;林福辉;徐晶明;蒋斌 - 展讯通信(上海)有限公司
  • 2012-10-31 - 2017-02-22 - G10L25/90
  • 本发明公开一种语音基音频率检测方法和装置。其中在语音基音频率检测方法中,检测语音信号帧中的单调分量,利用频谱幅值最大的M个单调分量的频率确定候选基频,并将候选基频放置在候选基频集合中,计算候选基频集合中每个候选基频的和谐判据,将具有最大和谐判据的候选基频作为所述语音信号帧的基频。通过利用具有较大能量的单调分量作为基音检测的基础,从而提高了基音检测在有噪环境下的准确率。
  • 显示音频信息的方法和装置-201610798582.1
  • 呼伦夫 - 天脉聚源(北京)科技有限公司
  • 2016-08-31 - 2017-02-01 - G10L25/90
  • 本发明公开了一种显示音频信息的方法和装置,属于通信领域。所述方法包括预先生成音符模型;实时采集音频信息,并解析所述音频信息得到幅度;按照预设的对应关系,将所述幅度转换为所述音符模型内音符跳动的高度值;显示所述音符模型,且控制所述音符模型内的音符按照所述高度值进行跳动。所述装置包括生成模块、采集模块、转换模块和控制模块。本发明能够在画面上显示出音频信号的变化,更清晰直观,克服了传统展示方式单一、沉闷的局限性,提高了音频信息的展示效果,极大地提升了用户体验。
  • 音频处理方法和装置-201510407956.8
  • 张圣杰 - 努比亚技术有限公司
  • 2015-07-13 - 2015-12-02 - G10L25/90
  • 本发明公开了一种音频处理方法,所述方法包括以下步骤:获得所述音频的频谱图,所述频谱图包括音频的基音和泛音;在显示界面显示所述音频的频谱图;在接收到用户在所述显示界面触发的修改命令时,修改所述音频的基音和泛音。本发明还公开了一种音频处理装置。本发明利用声音包括基音和泛音组成的现象,能修改音频的基音和泛音,从而修改音频,能美化音频,增强了移动终端的可玩性,提高了用户体验。
  • 音频处理方法及装置-201510342645.8
  • 曾元清 - 广东欧珀移动通信有限公司
  • 2015-06-17 - 2015-09-23 - G10L25/90
  • 本发明涉及一种音频处理方法及装置。所述方法包括步骤:在接收到音频处理指令时,获取待检测音频;检测待检测音频的波形,判断波形中是否有满足垃圾波段判定条件的波段;若有,将满足垃圾波段判定条件的波段从波形中删除。所述装置包括:待检测音频获取模块,用于在接收到音频处理指令时,获取待检测音频;垃圾波段检测模块,用于检测待检测音频的波形,判断波形中是否有满足垃圾波段判定条件的波段;垃圾波段删除模块,用于在有满足垃圾波段判定条件的波段时,将满足垃圾波段判定条件的波段从波形中删除。本发明不需要人工选定时间段一段一段的进行剪切,实现了音频的自动剪切,尤其在音频较长时,大大提高了音频剪切的效率。
  • 电话线质量语音的基音周期提取方法-201510017199.3
  • 常亮;唐昆;崔慧娟 - 清华大学
  • 2015-01-13 - 2015-05-06 - G10L25/90
  • 本发明提出一种电话线质量语音的基音周期提取方法,包括以下步骤:对原始语音进行非线性处理,计算原始语音的第一时域自相关函数和非线性处理后的语音的第二时域自相关函数;融合第一时域自相关函数和第一时域自相关函数得到第三时域自相关函数;计算原始语音中每一帧的长时基音周期,并据此对第三时域自相关函数进行修正;对原始语音进行LPC逆滤波得到余量信号,并进行FFT变换,根据变换结果计算频域自相关函数;根据第三时域自相关函数和频域自相关函数计算基音周期候选值的时域权重和频域权重,并进一步得到最终权重;根据最终权重进行路径规划,以确定最终的基音周期值。本发明的方法在对电话线质量语音提取时,具有准确度高的优点。
  • 一种音高检测方法-201410383633.5
  • 张天骐;徐昕;张刚;石穗;张亚娟 - 重庆邮电大学
  • 2014-08-06 - 2014-12-10 - G10L25/90
  • 本发明请求保护一种音高检测方法。它针对基于内容的音乐检索中音高检测技术较差问题进行了研究。先将信号利用傅里叶变换将音乐信号转换到频域上进行计算,根据谐波峰值法对信号进行音高检测的第一步,即找到5个较低频率的谐波峰,并按其频率大小升序排列,之后计算各频率之间的比值,根据实验所测得的数据确定一组音高候选序列,再采用倒谱法对原有的音乐信号进行音高检测,将两种方法所得到的音高序列组合成一个新的音高候选序列,最后利用置信度和维特比最优算法,寻找最小代价对应的音高,即为本方法获得的标准音高。本发明具有很好的鲁棒性,抗噪性能好。
  • 检测语音信号的方法和装置-201210580541.7
  • 许丽净 - 华为技术有限公司
  • 2012-12-27 - 2014-07-02 - G10L25/90
  • 一种检测语音信号的方法和装置。方法包括:以第一时帧帧长为单位对连续语音样本进行分帧以得到多个第一时帧,检测每一个第一时帧的能量,通过分析多个第一时帧的能量之间的关系确定包含潜在的语音信号的异常的目标第一时帧;以第二时帧帧长为单位,对连续语音样本进行分帧以得到多个第二时帧,每个第二时帧帧长为第一时帧帧长的整数倍,其中,包括目标第一时帧的第二时帧为目标第二时帧;对每个第二时帧进行处理以获取音调特征,通过分析至少一个包括至少一个目标第二时帧的第二时帧的音调特征,以确定目标第二时帧所包括的目标第一时帧所包含的潜在的语音信号的异常是否为真正的语音信号的异常。该技术方案能够提高检测语音信号的异常的准确性。
  • 对比用户音频与原唱音频相似度的方法及其系统-201210541543.5
  • 王雷 - 上海八方视界网络科技有限公司
  • 2012-12-13 - 2014-06-18 - G10L25/90
  • 本发明公开了一种对比用户音频与原唱音频相似度的方法及其系统,属于音频处理领域,本发明对输入的用户音频,进行音频片段特征提取,用归一化的方法对音频片段特征进行优化,使用DTW算法对优化后的音频片段特征进行相似度对比,从而达到对比用户音频与原唱音频相似度的目的。采用本发明提供的解决方案,能有效对比用户歌声与原唱的相似程度,可在音乐服务领域有着广泛的应用,如KTV评价用户歌声、鉴别劣质音像制品等。
  • 检测基音周期的正确性的方法和装置-201210155298.4
  • 齐峰岩;苗磊 - 华为技术有限公司
  • 2012-05-18 - 2013-12-04 - G10L25/90
  • 本发明实施例提供了一种检测基音周期正确性的方法和装置。其中,检测基音周期正确性的方法,包括:依据输入信号在时域上的初始基音周期确定所述输入信号的基频点,其中初始基音周期是对所述输入信号进行开环检测得到;基于所述输入信号在频域上的幅度谱确定所述输入信号的与基频点关联的基音周期正确性判决参数;根据所述基音周期正确性判决参数确定所述初始基音周期的正确性。本发明实施例的检测基音周期的正确性的方法和装置能够基于复杂度较低的算法提升基音周期的正确性检测的准确度。
  • 估计信号模式的方法和设备-201180054354.9
  • E.F.奇奇 - 皇家飞利浦电子股份有限公司
  • 2011-11-07 - 2013-07-03 - G10L25/90
  • 本发明涉及一种用于估计模式,具体地说,估计具有周期分量、准周期分量或实际周期分量的信号中的基音和/或基频的方法,其中所述信号从时域变换为频域以获取所述信号的频谱,对所述频谱进行处理以获取所述信号的零相位频谱,所述信号的频谱被变换为所述时域以获取相关信号,所述频谱和所述相关信号被组合为组合频谱,以及根据所述组合频谱估计所述模式。
  • 汉语普通话儿化音发音质量评测方法与系统-201310075517.2
  • 张珑;单琳琳;解瑞峰;王建华;季伟东;梁鹏 - 哈尔滨师范大学
  • 2013-03-11 - 2013-06-26 - G10L25/90
  • 汉语普通话儿化音发音质量评测方法与系统,涉及一种语音评测方法及评测系统。本发明在现有发音质量评测方法基础上,一方面扩展标准的汉语声韵母发音空间,使其包括所有的儿化韵母,建立包含儿化韵母的扩展声韵母模型,并在包含儿化韵母的扩展发音空间内进行更大范围的发音质量评测;另一方面,在包含儿化韵母的扩展发音空间内进行发音质量评测时,把对儿化音发音质量评测问题转化为儿化音发音质量分类问题,建立儿化音发音质量分类模型,通过提取儿化音节及其前面音节的多种声学特征、语言学特征、以及它们的统计特征和动态变化特征,获取该儿化音的发音质量等级,进而完成儿化音发音质量评测,能有效提高汉语普通话儿化音发音质量评测的正确率。
  • 估计音调滞后-201180044585.1
  • 文卡特什·克里希南;斯特凡那·皮埃尔·维莱特 - 高通股份有限公司
  • 2011-09-09 - 2013-05-15 - G10L25/90
  • 本发明描述一种用于估计音调滞后的电子装置。所述电子装置包括处理器和存储于与所述处理器电子通信的存储器中的可执行指令。所述电子装置获得当前帧。所述电子装置还基于所述当前帧获得残余信号。所述电子装置另外基于所述残余信号确定峰值位置集合。此外,所述电子装置基于所述峰值位置集合获得音调滞后候选者集合。所述电子装置还基于所述音调滞后候选者集合估计音调滞后。
  • 语音数据的测评装置-201220128139.0
  • 孟子厚;韩卫生;谢凌云;潘兴德;章斯宇 - 北京中传天籁数字技术有限公司
  • 2012-03-29 - 2013-02-27 - G10L25/90
  • 本实用新型涉及一种语音数据的测评装置,语音数据的测评装置包括:采集单元、提取单元、处理单元和映射单元;采集单元与提取单元相连接,提取单元与处理单元相连接,处理单元与映射单元相连接;采集单元采集测评汉语语音的测评发音数据;提取单元从测评发音数据中按照专家知识数据库中的专家知识数据提取特征参数,从特征参数中查询典型偏误特征;处理单元根据特征参数得到客观测评结果数据;映射单元将客观测评结果数据利用评分映射关系进行映射处理得到主观测评结果数据。语音数据的测评装置利用语言生态学的方法,实现非汉语母语语音数据的准确的检测和测评,从而有效的指导检测者的发音。
专利分类
×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

400-8765-105周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top