[发明专利]一种灯光或电机与声音同步的自适应检测方法有效

专利信息
申请号: 201210585467.8 申请日: 2012-12-30
公开(公告)号: CN103050119A 公开(公告)日: 2013-04-17
发明(设计)人: 王晓斐;孙秀明;谢信珍;黄海兵 申请(专利权)人: 安徽科大讯飞信息科技股份有限公司
主分类号: G10L19/00 分类号: G10L19/00;G10L25/27
代理公司: 北京科迪生专利代理有限责任公司 11251 代理人: 成金玉
地址: 230088 安徽省*** 国省代码: 安徽;34
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 灯光 电机 声音 同步 自适应 检测 方法
【说明书】:

技术领域

发明涉及一种灯光或电机与声音同步的自适应检测方法,属于数字信号处理技术领域。

背景技术

目前,传统玩具上的口型动作与声音的适配、灯光效果与声音的适配是通过人工标注的方式来实现的,这样做有很大的局限性:每一个音频都需要进行人工标注,最终的效果和标注人员的熟练程度息息相关;对于用户自己拷贝的内容时无法实现口自动检测以及同步;只能对固定音频进行同步,无法对外界的音源发出的声音进行检测和同步。

发明内容

本发明技术解决问题:克服现有技术的不足,提供一种声光、声电同步检测方法,实现自动声光、声电的检测,避免了人工标注的麻烦,而且还可以通过倾听用户的声音,模仿用户的口型,实现跟儿童更好的互动。

本发明采用了以下技术方案:一种灯光或电机与声音同步的自适应检测方法,其特点在于:通过音源的语音通过带AGC控制的ADC(1)检测到后输出带AGC信息的语音信号(2),使用能量归一化算法(3)对带AGC信息的语音信号(2)进行处理后生成宽动态范围的语音信号(4),以实现了对距离的自适应;采用宽动态范围的语音信号(4)计算实时能量(5)和带反馈的实时门限(6),然后把生成的结果进行比较,通过实时能量和门限的比较,得到实时的电机开合状态或灯光亮灭状态(7),电机开合状态或灯光亮灭状态(7)一方面用于配合音频进行输出,另一方面为带反馈的实时门限(6)提供反馈信息,实现了检测自动化过程。

所述带AGC控制的ADC(1)对硬件和软件均有要求,其中:

硬件部分:带AGC控制的ADC必须具备3个条件:(1)要有可编程增益放大器PGA,即能够通过软件的方式对增益进行控制;(2)可编程增益放大器PGA每一级的增益在0.5(1dB,否则出现音频能量跳变明显而出现录音噪声,影响效果;(3)所用的ADC至少要有12bit精度,不一定要16bit精度,可以降低ADC的制造成本。

软件部分:对音频设置一个上门限,当录音样本的值大于这个上门限的时候,把录音增益降低一级;对每一帧的音频能量设置一个下门限,当这一帧的能量低于这个下门限的时候,系统的放大增益需要调高,需要把录音增益提高一级。

所述能量归一化算法(3)实现过程如下:

(1)确定每一个AGC的值所对应的可编程增益放大器PGA的增益放大倍数,作成表格,使用查表的方式来快速检索;

(2)确定归一化系数,归一化系数为整段音频中最大的AGC值A;

(3)根据每一个样本对应AGC值计算出能量归一化到指定增益所需要的放大倍数X;

(4)根据X计算出能量归一化后的样本值。

所述带反馈的实时门限(6)的计算过程如下:

(1)设定一个能量的基线值Baseline;

(2)Baseline的初值设定为语音起始3帧能量的均值;

(3)实际检测中,每一个实时帧都会对Baseline的值进行更新;

(4)把实际帧能量高于门限和低于门限分为2种状态,两种状态下对Baseline的更新系数是不一样的;

(5)根据人体工学原理确定两种状态下的更新系数,能量高于门限时的更新系数应该符合人所能发的单音的最长时长,更新系数较小;能量低于门限时更新系数应该符合人在说话时换气的时长,更新系数较大。

所述实时能量(5)的计算过程如下:

(1)为了满足实时性要求,设定每次检测的时长宽度为1帧10ms;

(2)使用求平方和的方式进行能量计算;

(3)针对部分语音类玩具内部有简化版DSP并支持MAC指令的特性,把能量的精度控制在40bit,保持较高的精度并取得较好的检出效果。

本发明原理:语音的声压信号在被带AGC控制的ADC(模拟信号到数字信号转换装置)检测到后,变为带AGC信息的窄动态范围语音信号,使用能量归一化算法把带AGC信息的窄动态范围语音信号还原为宽动态范围语音信号,然后用还原后的语音信号进行语音的实时能量计算和门限计算,通过实时能量和门限的比较,计算出当前语音帧对应的电机的开合状态或灯光的亮灭状态。

本发明与现有技术相比的优点在于:

(1)本发明由于使用了能量归一化算法,可以使用带AGC的低精度ADC代替高精度ADC,但同时又保持基本相同效果的动态范围;同时,由于对门限进行实时计算、通过对电机开合状态或灯光亮灭状态的监控可以对门限进行反馈,使得本方法对带有背景音乐的语音可以实现较好的电机开合、灯光亮灭信息检出效果。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于安徽科大讯飞信息科技股份有限公司,未经安徽科大讯飞信息科技股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201210585467.8/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top