[发明专利]一种灯光或电机与声音同步的自适应检测方法有效
申请号: | 201210585467.8 | 申请日: | 2012-12-30 |
公开(公告)号: | CN103050119A | 公开(公告)日: | 2013-04-17 |
发明(设计)人: | 王晓斐;孙秀明;谢信珍;黄海兵 | 申请(专利权)人: | 安徽科大讯飞信息科技股份有限公司 |
主分类号: | G10L19/00 | 分类号: | G10L19/00;G10L25/27 |
代理公司: | 北京科迪生专利代理有限责任公司 11251 | 代理人: | 成金玉 |
地址: | 230088 安徽省*** | 国省代码: | 安徽;34 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 灯光 电机 声音 同步 自适应 检测 方法 | ||
技术领域
本发明涉及一种灯光或电机与声音同步的自适应检测方法,属于数字信号处理技术领域。
背景技术
目前,传统玩具上的口型动作与声音的适配、灯光效果与声音的适配是通过人工标注的方式来实现的,这样做有很大的局限性:每一个音频都需要进行人工标注,最终的效果和标注人员的熟练程度息息相关;对于用户自己拷贝的内容时无法实现口自动检测以及同步;只能对固定音频进行同步,无法对外界的音源发出的声音进行检测和同步。
发明内容
本发明技术解决问题:克服现有技术的不足,提供一种声光、声电同步检测方法,实现自动声光、声电的检测,避免了人工标注的麻烦,而且还可以通过倾听用户的声音,模仿用户的口型,实现跟儿童更好的互动。
本发明采用了以下技术方案:一种灯光或电机与声音同步的自适应检测方法,其特点在于:通过音源的语音通过带AGC控制的ADC(1)检测到后输出带AGC信息的语音信号(2),使用能量归一化算法(3)对带AGC信息的语音信号(2)进行处理后生成宽动态范围的语音信号(4),以实现了对距离的自适应;采用宽动态范围的语音信号(4)计算实时能量(5)和带反馈的实时门限(6),然后把生成的结果进行比较,通过实时能量和门限的比较,得到实时的电机开合状态或灯光亮灭状态(7),电机开合状态或灯光亮灭状态(7)一方面用于配合音频进行输出,另一方面为带反馈的实时门限(6)提供反馈信息,实现了检测自动化过程。
所述带AGC控制的ADC(1)对硬件和软件均有要求,其中:
硬件部分:带AGC控制的ADC必须具备3个条件:(1)要有可编程增益放大器PGA,即能够通过软件的方式对增益进行控制;(2)可编程增益放大器PGA每一级的增益在0.5(1dB,否则出现音频能量跳变明显而出现录音噪声,影响效果;(3)所用的ADC至少要有12bit精度,不一定要16bit精度,可以降低ADC的制造成本。
软件部分:对音频设置一个上门限,当录音样本的值大于这个上门限的时候,把录音增益降低一级;对每一帧的音频能量设置一个下门限,当这一帧的能量低于这个下门限的时候,系统的放大增益需要调高,需要把录音增益提高一级。
所述能量归一化算法(3)实现过程如下:
(1)确定每一个AGC的值所对应的可编程增益放大器PGA的增益放大倍数,作成表格,使用查表的方式来快速检索;
(2)确定归一化系数,归一化系数为整段音频中最大的AGC值A;
(3)根据每一个样本对应AGC值计算出能量归一化到指定增益所需要的放大倍数X;
(4)根据X计算出能量归一化后的样本值。
所述带反馈的实时门限(6)的计算过程如下:
(1)设定一个能量的基线值Baseline;
(2)Baseline的初值设定为语音起始3帧能量的均值;
(3)实际检测中,每一个实时帧都会对Baseline的值进行更新;
(4)把实际帧能量高于门限和低于门限分为2种状态,两种状态下对Baseline的更新系数是不一样的;
(5)根据人体工学原理确定两种状态下的更新系数,能量高于门限时的更新系数应该符合人所能发的单音的最长时长,更新系数较小;能量低于门限时更新系数应该符合人在说话时换气的时长,更新系数较大。
所述实时能量(5)的计算过程如下:
(1)为了满足实时性要求,设定每次检测的时长宽度为1帧10ms;
(2)使用求平方和的方式进行能量计算;
(3)针对部分语音类玩具内部有简化版DSP并支持MAC指令的特性,把能量的精度控制在40bit,保持较高的精度并取得较好的检出效果。
本发明原理:语音的声压信号在被带AGC控制的ADC(模拟信号到数字信号转换装置)检测到后,变为带AGC信息的窄动态范围语音信号,使用能量归一化算法把带AGC信息的窄动态范围语音信号还原为宽动态范围语音信号,然后用还原后的语音信号进行语音的实时能量计算和门限计算,通过实时能量和门限的比较,计算出当前语音帧对应的电机的开合状态或灯光的亮灭状态。
本发明与现有技术相比的优点在于:
(1)本发明由于使用了能量归一化算法,可以使用带AGC的低精度ADC代替高精度ADC,但同时又保持基本相同效果的动态范围;同时,由于对门限进行实时计算、通过对电机开合状态或灯光亮灭状态的监控可以对门限进行反馈,使得本方法对带有背景音乐的语音可以实现较好的电机开合、灯光亮灭信息检出效果。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于安徽科大讯飞信息科技股份有限公司,未经安徽科大讯飞信息科技股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201210585467.8/2.html,转载请声明来源钻瓜专利网。