[发明专利]唱歌评测方法及系统有效
申请号: | 201210120560.1 | 申请日: | 2012-04-23 |
公开(公告)号: | CN102664016A | 公开(公告)日: | 2012-09-12 |
发明(设计)人: | 蒋成林;何婷婷;胡国平;胡郁;刘庆峰 | 申请(专利权)人: | 安徽科大讯飞信息科技股份有限公司 |
主分类号: | G10L19/00 | 分类号: | G10L19/00;G10L15/04;G10L15/06;G10L15/14 |
代理公司: | 北京集佳知识产权代理有限公司 11227 | 代理人: | 赵景平;王宝筠 |
地址: | 230088 安徽*** | 国省代码: | 安徽;34 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 唱歌 评测 方法 系统 | ||
技术领域
本发明涉及语音信号处理技术领域,特别涉及一种唱歌评测方法及系统。
背景技术
近年来,一些卡拉OK产品在用户演唱结束后给出计分,提高了娱乐互动性。传统唱歌评分系统通常采用比较用户唱歌语音数据的音高曲线及预设标准音高曲线差异的方法,通过直接计算它们基频曲线之间的误差面积大小或在利用动态时间规整(Dynamic Time Warping,简称DTW)等技术对基频曲线对齐规整后计算基频曲线之间的差异来评价唱歌水平的高低。曲线差异值越大则用户唱歌数据得分越低;反之则用户唱歌数据得分越高。该方法在用户数据与标准音高曲线节奏不一致时容易导致评分过低的问题。
为此,业界提出了一种基于连续语音信号切分的单独唱词片断基频标准度评估的方法。该方法首先将连续语音信号相对于各唱词单元进行对齐,随后对切分的音符语音片断的标准度进行评估,进而获知连续语音信号的标准度。通过唱词对齐实现了用户语音信号和标准参考信号的有效对应,可以使评判评分更加准确合理。
显然,基于唱词对齐的音符评分系统性能的好坏主要依赖于音符对齐效果以及单独唱词片段的评分结果。音符对齐越准确以及单个唱词片段评分越客观,则整体评分结果越合理。现有技术中通常采用距离度量的方法计算单个唱词片断的标准度,即将提取的唱词片段的声学特征,如音高特征和系统预存的基于乐谱构建的音符标准音高匹配并计算差异。然而在实际应用中,用户音高往往存在波动,如通常所说的Vibration(颤音)现象;另外音高也容易受到上下文影响,在不同音符转换时存在如通常所说的Preparation(预准备)、OverShort的现象,在实际音高曲线上不是表现为自然的连接曲线,而是需要经历一个准备过程和后续过程。在不同音符切换时,用户无法实现高低音的跳跃,而是需要经历一个连续过程;另外相同音符在不同上下文环境中会表现出一定的差异性。可见,即使用户的音高曲线与乐谱设定的标准音高走势完全一致,但由于根据乐谱标准值设定的标准音高曲线,由于无法体现音符的上下文相关变化,无法准确细致地模拟用户音高变化曲线,用户音高变化曲线中的各种噪音干扰使得用户最终评分较低,影响到对唱歌评测的合理性。
为了更好地模拟音符在不同上下文中的变化,研究人员提出了基于音高曲线拟和的方法,设定音高曲线y(t)为标准音符值h(t)和二阶阻尼函数f(t)的卷积加上一个误差函数e(t),即:
y(t)=f(t)*h(t)+e(t)。
对给定待测唱词片段,系统针对唱歌时的Preparation、OverShort、Vibration等现象采用不同的样条曲线加权拟和用户的音高曲线,并通过参数估计实现用户音高曲线的分解,得到用户真实的音高值,随后据此和预设标准值比较计算差异。
这种基于音高曲线拟和的方法在计算每个音符真实音高时需要估计较多的参数值,而在音符时长有限(短的只有0.1秒)的情况下,训练数据量相对较少,因而容易过拟合导致参数估计不够鲁棒,影响系统的评测性能。
发明内容
本发明实施例提供一种唱歌评测系统及方法,提高音符匹配的客观性和准确性,提升唱歌评测系统的评测性能。
一种唱歌评测方法,包括:
接收用户唱歌的连续语音信号;
确定所述连续语音信号中每个音符的边界位置,以切分出每个音符;
选择切分出的每个音符对应的音调模型,所述音调模型是预先以离线方式训练得到的;
提取所述音符的音调特征;
根据所述音符的音调特征、以及与所述音符相对应的音调模型计算所述音符的标准度;
根据所述音符的标准度确定唱歌评测得分。
优选地,所述方法还包括:
将预先采集的歌曲训练数据切分为与不同音符对应的语音片段;
按照所述语音片段对应的音符对所述语音片段归类;
对每一类语音片断,分别按时间顺序提取其中每一个语音片断的音调特征,生成对应所述音符的特征序列;
构建音调模型拓扑;
对每个音符,利用该音符对应的所有训练数据的特征序列训练对应所述音调模型拓扑的参数;
所述选择切分出的每个音符对应的音调模型包括:
选择切分出的每个音符对应的用于模拟音符的音高特征的音调模型;
所述提取所述音符的音调特征包括:
提取每个音符的基频特征或音高特征,并将所述基频特征或音高特征作为所述音调特征。
优选地,所述方法还包括:
将预先采集的歌曲训练数据切分为与不同音符对应的语音片段;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于安徽科大讯飞信息科技股份有限公司,未经安徽科大讯飞信息科技股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201210120560.1/2.html,转载请声明来源钻瓜专利网。
- 上一篇:传感器网络节点的定位方法及装置
- 下一篇:无线传感网络节点定位的方法