[发明专利]唱歌评测方法及系统有效

申请号：	201210120560.1	申请日：	2012-04-23
公开（公告）号：	CN102664016A	公开（公告）日：	2012-09-12
发明（设计）人：	蒋成林;何婷婷;胡国平;胡郁;刘庆峰	申请（专利权）人：	安徽科大讯飞信息科技股份有限公司
主分类号：	G10L19/00	分类号：	G10L19/00;G10L15/04;G10L15/06;G10L15/14
代理公司：	北京集佳知识产权代理有限公司 11227	代理人：	赵景平;王宝筠
地址：	230088 安徽***	国省代码：	安徽;34
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	唱歌评测方法系统
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【说明书】：

技术领域

本发明涉及语音信号处理技术领域，特别涉及一种唱歌评测方法及系统。

背景技术

近年来，一些卡拉OK产品在用户演唱结束后给出计分，提高了娱乐互动性。传统唱歌评分系统通常采用比较用户唱歌语音数据的音高曲线及预设标准音高曲线差异的方法，通过直接计算它们基频曲线之间的误差面积大小或在利用动态时间规整(Dynamic Time Warping，简称DTW)等技术对基频曲线对齐规整后计算基频曲线之间的差异来评价唱歌水平的高低。曲线差异值越大则用户唱歌数据得分越低；反之则用户唱歌数据得分越高。该方法在用户数据与标准音高曲线节奏不一致时容易导致评分过低的问题。

为此，业界提出了一种基于连续语音信号切分的单独唱词片断基频标准度评估的方法。该方法首先将连续语音信号相对于各唱词单元进行对齐，随后对切分的音符语音片断的标准度进行评估，进而获知连续语音信号的标准度。通过唱词对齐实现了用户语音信号和标准参考信号的有效对应，可以使评判评分更加准确合理。

显然，基于唱词对齐的音符评分系统性能的好坏主要依赖于音符对齐效果以及单独唱词片段的评分结果。音符对齐越准确以及单个唱词片段评分越客观，则整体评分结果越合理。现有技术中通常采用距离度量的方法计算单个唱词片断的标准度，即将提取的唱词片段的声学特征，如音高特征和系统预存的基于乐谱构建的音符标准音高匹配并计算差异。然而在实际应用中，用户音高往往存在波动，如通常所说的Vibration(颤音)现象；另外音高也容易受到上下文影响，在不同音符转换时存在如通常所说的Preparation(预准备)、OverShort的现象，在实际音高曲线上不是表现为自然的连接曲线，而是需要经历一个准备过程和后续过程。在不同音符切换时，用户无法实现高低音的跳跃，而是需要经历一个连续过程；另外相同音符在不同上下文环境中会表现出一定的差异性。可见，即使用户的音高曲线与乐谱设定的标准音高走势完全一致，但由于根据乐谱标准值设定的标准音高曲线，由于无法体现音符的上下文相关变化，无法准确细致地模拟用户音高变化曲线，用户音高变化曲线中的各种噪音干扰使得用户最终评分较低，影响到对唱歌评测的合理性。

为了更好地模拟音符在不同上下文中的变化，研究人员提出了基于音高曲线拟和的方法，设定音高曲线y(t)为标准音符值h(t)和二阶阻尼函数f(t)的卷积加上一个误差函数e(t)，即：

y(t)＝f(t)*h(t)+e(t)。

对给定待测唱词片段，系统针对唱歌时的Preparation、OverShort、Vibration等现象采用不同的样条曲线加权拟和用户的音高曲线，并通过参数估计实现用户音高曲线的分解，得到用户真实的音高值，随后据此和预设标准值比较计算差异。

这种基于音高曲线拟和的方法在计算每个音符真实音高时需要估计较多的参数值，而在音符时长有限(短的只有0.1秒)的情况下，训练数据量相对较少，因而容易过拟合导致参数估计不够鲁棒，影响系统的评测性能。

发明内容

本发明实施例提供一种唱歌评测系统及方法，提高音符匹配的客观性和准确性，提升唱歌评测系统的评测性能。

一种唱歌评测方法，包括：

接收用户唱歌的连续语音信号；

确定所述连续语音信号中每个音符的边界位置，以切分出每个音符；

选择切分出的每个音符对应的音调模型，所述音调模型是预先以离线方式训练得到的；

提取所述音符的音调特征；

根据所述音符的音调特征、以及与所述音符相对应的音调模型计算所述音符的标准度；