[发明专利]一种声调评测方法有效

专利信息
申请号: 201110370038.4 申请日: 2011-11-18
公开(公告)号: CN102419973A 公开(公告)日: 2012-04-18
发明(设计)人: 柯登峰;徐波;王士进;陈振标;李宏言 申请(专利权)人: 中国科学院自动化研究所
主分类号: G10L11/04 分类号: G10L11/04;G10L15/06
代理公司: 中科专利商标代理有限责任公司 11021 代理人: 周国城
地址: 100190 *** 国省代码: 北京;11
权利要求书: 查看更多 说明书: 查看更多
摘要: 发明公开了一种声调评测方法。该方法包括:从待评测语音中提取声调识别特征,声调识别特征包含基频曲线特征;将声调识别特征送入训练后的声调识别模型,获得每一个声调的识别得分;提取得分最高的声调及其识别得分作为第一评测特征,标准声调和标准声调识别得分作为第二评测特征;将第一声调评测特征和第二声调评测特征合并成4维的声调评测特征,送入训练后的声调评测模型,获得待评测语音的声调评测得分。本发明声调评测方法可以获得更加良好的声调评测性能。
搜索关键词: 一种 声调 评测 方法
【主权项】:
一种声调评测方法,其特征在于,包括:从待评测语音中提取声调识别特征,所述声调识别特征包含基频曲线特征;将所述声调识别特征送入训练后的声调识别模型,获得每一个声调的识别得分;提取得分最高的声调及其识别得分作为第一评测特征,标准声调和标准声调识别得分作为第二评测特征;将第一声调评测特征和第二声调评测特征合并成4维的声调评测特征,送入训练后的声调评测模型,获得所述待评测语音的声调评测得分。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国科学院自动化研究所,未经中国科学院自动化研究所许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/patent/201110370038.4/,转载请声明来源钻瓜专利网。

同类专利
  • 一种基音检测的方法和装置-201110170075.0
  • 齐峰岩;苗磊;阿里斯·塔勒布 - 华为技术有限公司
  • 2011-06-22 - 2012-12-26 - G10L11/04
  • 本发明公开了一种基音检测的方法和装置,属于语音与音频领域。该基音检测的方法,包括:在时域对所述语音信号进行基音检测,得到初始基音周期;将所述语音信号转换到频域,获得语音信号的频谱,该频谱包括频谱的幅度谱;根据初始基音周期和所述语音信号的频谱提取特征参数;根据初始基音周期和特征参数进行精细基音周期检测,得到精细基音周期。
  • FM频率和幅度测试方法-201110042802.5
  • 吴三江 - 上海晨兴希姆通电子科技有限公司
  • 2011-02-23 - 2012-08-29 - G10L11/04
  • 本发明公开了一种FM频率和幅度测试方法,其包括以下步骤:S1、通过FM发射接口,将一FM发射器外接于一电脑上;S2、采用所述电脑自带的播放器播放一段固定频率的标配音乐;S3、带FM功能的产品通过FM耳机天线接收所述标配音乐;S4、将接收到的FM信号输入所述电脑,并利用音频测试软件对所述FM信号进行解码,分析得到FM频率和幅度的大小。本发明通过FM发射器将标配音乐发送给带FM功能的产品,再反馈给测试软件,从而实现对FM指标频率和幅度的准确定位,达到验证FM功能测试效果一致的目的。
  • 一种动态归一化数字特征的语音评分方法与装置-201210042642.9
  • 宁更新;林广超;韦岗 - 华南理工大学
  • 2012-02-23 - 2012-07-18 - G10L11/04
  • 本发明公开一种动态归一化数字特征的语音评分方法与装置,所述评分方法包括:对目标音进行数字化处理后进行分帧;提取原音和目标音的动态特征,得到若干组动态特征序列,对这些序列进行归一化操作得到归一化的动态特征;计算原音与目标音各个共振峰的相似度,计算出原音与目标音之间的误差,由各个共振峰的误差能判断总体的误差,根据总体误差进行评分。所述装置包括顺次信号连接的数字化模块、分帧模块、计算模块、比较模块和显示模块。本发明装置结构简单,按照方便,从频域的角度出发,提取原音与目标声音的归一化共振峰动态特征,进行语音评分,来消除现有评分系统采用静态特征评分带来的不足,评分结果更为客观。
  • 基音估计-201080021855.2
  • 萨默尔·加德尔 - 剑桥硅无线电有限公司
  • 2010-04-07 - 2012-07-18 - G10L11/04
  • 一种用于估计信号的基音周期的方法和装置。该方法包括:通过仅在潜在基音周期的第一范围上执行搜索来识别第一候选基音周期。该方法还包括:通过将第一候选基音周期除以整数来确定第二候选基音周期,其中,第二候选基音周期在潜在基音周期的第一范围之外。该方法还包括:选择候选基音周期中的较小者作为信号的基音周期的估计,该候选基音周期中的较小者使得以此候选基音周期分离的信号部分被良好相关。
  • 一种声调评测方法-201110370038.4
  • 柯登峰;徐波;王士进;陈振标;李宏言 - 中国科学院自动化研究所
  • 2011-11-18 - 2012-04-18 - G10L11/04
  • 本发明公开了一种声调评测方法。该方法包括:从待评测语音中提取声调识别特征,声调识别特征包含基频曲线特征;将声调识别特征送入训练后的声调识别模型,获得每一个声调的识别得分;提取得分最高的声调及其识别得分作为第一评测特征,标准声调和标准声调识别得分作为第二评测特征;将第一声调评测特征和第二声调评测特征合并成4维的声调评测特征,送入训练后的声调评测模型,获得待评测语音的声调评测得分。本发明声调评测方法可以获得更加良好的声调评测性能。
  • 基音周期估计值修正方法、基音估计方法和相关装置-201110118266.2
  • 党红强;刘贵忠;顿玉洁;杜正中 - 华为技术有限公司
  • 2011-05-09 - 2011-11-02 - G10L11/04
  • 本发明提供基音周期估计值修正方法,包括:当前子帧在当前频率区域内MCAMD的序列最大值MAmax(i+1)大于中间变量MAmax的加权值时,分别以MAmax(i+1)和MAmax(i+1)的延迟替代中间变量MAmax和中间变量Topt;若中间变量Topt与当前子帧前奇数个子帧的基音周期估计中值Tpre_mid_o的比值小于校正因子r1或大于校正因子r2并且Tpre_mid_o邻近范围内当前子帧的MCAMD的序列最大值MAmax0大于中间变量MAmax与经验因子ρ2的乘积,用MAmax0对应的延迟T0校正中间变量Topt;将当前子帧前偶数个子帧的基音周期估计值与中间变量Topt进行中值滤波。
  • 汉语语音识别方法-201110125829.0
  • 梁向东;唐勇明 - 南宁向明信息科技有限责任公司
  • 2011-05-16 - 2011-10-05 - G10L11/04
  • 本发明公开了一种汉语语音识别方法,具体为:将拾音器输入的汉语语音进行A/D转换后,经音节界定、基波分析、对汉语单字进行声调/韵母/声母识别,最后将上述识别出的汉语语音声母、韵母、声调进行整合,输出汉语单字拼音序列;将识别出的各汉语单字拼音序列按顺序进行组合,即形成汉语句子的拼音序列。本汉语语音识别方法的优点:可对汉语声、韵母进行单音节分析;采用频域幅频特性分析技术,汉语韵母的识别率高;不需要在使用前对特定人语音进行学习或训练;能识别出汉语四个声调;能识别出非特定人的汉语语音单字和句子;采用自适应等效采样速率梳状DFT频谱分析算法,计算量小,占用存储单元少,便于移植应用到嵌入式设备上。
  • 信息处理装置、旋律线提取方法、低音线提取方法及程序-200910253629.6
  • 小林由幸 - 索尼株式会社
  • 2009-12-07 - 2010-12-15 - G10L11/04
  • 本发明公开了信息处理装置、旋律线提取方法、低音线提取方法及程序。提供了一种信息处理装置,包括:信号转换单元,用于将音频信号转换为表示每个音高的信号强度的音高信号;旋律概率估计单元,用于基于音频信号来针对每帧估计每个音高是旋律音符的概率;以及旋律线确定单元,用于基于每个音高是旋律音符的概率,即由旋律概率估计单元针对每帧估计出的概率,来从自音频信号的开始帧到结束帧的音高的路径中,检测最大似然路径,并且将最大似然路径确定为旋律线。
  • 一种测量音乐音高的装置-200920106696.0
  • 王路露;朱小明;张伟 - 王路露
  • 2009-04-03 - 2010-01-20 - G10L11/04
  • 本实用新型属于在音乐教学和娱乐领域中的电子测量仪器,尤其涉及对音乐音高信号进行采集,转换和测音高的一种测量音乐音高的装置。其包括音乐信号探测模块,音乐信号处理模块,音乐信号存储模块,中央信号处理模块以及通信模块。本实用新型通过标准的USB接口可以与计算机、教学设备、娱乐设备等主设备相连,实现数据的双向传输。音乐音高测量仪通过USB通讯单元接受主设备发出的指令和参数,按主设备要求进行音乐测量,并将测量结果回传给主设备,供进一步的统计分析和绘图显示。
  • 计算语音基音频率的方法及设备-200810043233.4
  • 黄鹤云;林福辉 - 展讯通信(上海)有限公司
  • 2008-04-09 - 2009-10-14 - G10L11/04
  • 本发明涉及信号处理领域,公开了一种计算语音基音频率的方法及设备,能够更为准确地估计基音频率。本发明中,在计算基音频率之前先对所用的频域信号进行重构,生成一个定义域连续的重构函数,该函数在各频域峰值附近的定义域中按相应的频域信号进行曲线拟合,在其它的定义域中对相应的频域信号进行有效抑制。在基音搜索时综合考虑候选基音频率及其多个倍频。
  • 基音滞后估计-200780043838.7
  • L·拉克索南;A·拉莫;A·瓦西拉谢 - 诺基亚公司
  • 2007-10-01 - 2009-09-23 - G10L11/04
  • 确定自相关值,作为音频信号片段中的基音滞后估计的基础。将用于自相关计算的第一所考虑延迟范围划分为第一组区段,针对该第一组区段的多个区段中的延迟来确定第一自相关值。将用于自相关计算的第二所考虑延迟范围划分为第二组区段,使得第一组的区段和第二组的区段重叠。针对该第二组区段的多个区段中的延迟来确定第二自相关值。
  • 声音信号的音框基本周期的计算方法及系统-200810208016.6
  • 陈进旺;官圳清 - 爱唱数码科技(上海)有限公司
  • 2008-12-25 - 2009-08-12 - G10L11/04
  • 本发明公开了一种声音信号的音框基本周期的计算方法及系统,此声音信号经音高检测演算后,在音框中的每个音高点均有对应坐标值(x,y),取最小x坐标值为基准值与累加值,并将其相加而得一比较值。将比较值与其余x坐标值进行比对,当比较值与x坐标值之间的差异值大于门坎值时,选取次一x坐标值为基准值与累加值重新进行比对;当差异值小于门坎值时,以此x坐标值取代基准值再次进行累加与比对的步骤。当比较值大于最大x坐标值时,利用累加值计算出声音信号之音框基本周期。此方法可解决已知时域音高算法误判音高点的问题,以提高音高检测的准确度。
  • 声音信号的音高参考点筛选方法及系统-200810208017.0
  • 陈进旺;官圳清 - 爱唱数码科技(上海)有限公司
  • 2008-12-25 - 2009-08-05 - G10L11/04
  • 本发明公开了一种声音信号的音高参考点筛选方法及系统,用于在声音信号于一音框中经音高检测演算后所产生之多个局部极值中筛选出音高参考点,其通过将这些局部极值依序分组比较y坐标值的大小,并在各次分组比较过程中选出y坐标值为最大值/最小值的局部极值。这些在比较过程中被选取的局部极值即为音高参考点。通过所述筛选过程可减少后续计算基本周期过程中需要列入考虑的信号点数量,以简化基本周期的运算,进而提升音高检测的准确度。
  • 声调识别方法和系统-200710177507.4
  • 许军;张化云;潘春雷;陈炜 - 创新未来科技有限公司
  • 2007-11-16 - 2009-05-20 - G10L11/04
  • 本发明涉及一种声调识别方法,包括以下步骤:接收语音信号;对所述语音信号进行频谱分析,并根据参考文本生成携带时间对准信息的语音序列;根据所述语音序列从接收到的语音信号中提取出声调音素;根据所述声调音素确定所述语音信号的声调。本发明还涉及了一种声调识别系统。本发明利用携带时间对准信息的语音序列准确地提取声调音素,确定输入语音信号的声调,从而可以有效地减少声调识别中的错误识别声调,实现了准确识别声调语言中的声调,从而提高了声调识别的可靠性。
专利分类
×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

400-8765-105周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top