[发明专利]一种人声音频信号采样处理方法在审
申请号: | 201611195815.5 | 申请日: | 2016-12-22 |
公开(公告)号: | CN106653040A | 公开(公告)日: | 2017-05-10 |
发明(设计)人: | 叶伟 | 申请(专利权)人: | 上海百芝龙网络科技有限公司 |
主分类号: | G10L21/0208 | 分类号: | G10L21/0208;G10K11/178 |
代理公司: | 上海伯瑞杰知识产权代理有限公司31227 | 代理人: | 孟旭彤 |
地址: | 200050 上海*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 人声 音频 信号 采样 处理 方法 | ||
技术领域
本发明属于智能家居技术领域,特别涉及一种人声音频信号采样处理方法。
背景技术
音频的采集处理过程中,降噪是一个关键步骤。在日常生活中,降噪是指消除噪音,而对于拥有更高要求的音频分类提取过程来说,噪声指的是除目标音源外的所有其他音频。通常对于音频降噪除噪的处理方法,有采样除噪法、噪声门等。
采样除噪法是一些专业音频处理软件比较有效除去持续稳定的背景噪音的一种方法,除噪的原理就是对噪音的波形样本进行取样,然后对争端素材的波形和采样噪音样本分析,自动去除噪音;噪声门则是设定一个电平的门限值,低于这个门限的信号电平全部过滤掉,高于门限值的信号电平全部通过。
使用音频处理软件虽然能够在一定程度上实现噪音消除,提取出目标音频,但也存在先录音、再处理,需要人工判断采样的缺点,从实用角度来讲极大限制了未来人工智能领域在语音解析方面的技术发展。
随着人工智能技术的发展,人机语音对话、声纹识别、语音与文字转换、语音语义解析等需求越来越强烈,对于音频的采样、降噪要求也飞速提升,特别是对与音频的实时分析处理,更是对产品起到至关重要的作用。
发明内容
本发明提供一种人声音频信号采样处理方法,目的是解决现有人声语音采集分析中抑制噪声的问题。
一种人声音频信号采样处理方法,包括以下步骤:
由麦克风侦测并收集无人声的环境噪音,该噪音的音频信号的模拟信号以96KHz或以上的采样频率采样,得到该噪音的数字信号序列;
计算获得与所述数字信号序列频谱相同、相位相差180°的抑噪信号数字序列,
将抑噪信号数字序列反向还原成模拟信号,将该抑噪模拟信号与麦克风采集的含有人声的音频信号混合,使得抑噪信号与噪音信号互相抵消,从而获取到清晰、无干扰的人声语音。
进一步的,
当环境在发出噪声音频时,麦克风采集该噪声音频,通过高采样率芯片将音频信号转换成一个数值序列,对该数值序列进行运算,获得与该音频信号频谱相同、相位相差180°的抑噪信号,
麦克风采集使用者的人声语音指令,抑噪信号通过音响播放,会与噪音抵消,从而使麦克风捕捉到的音频只有人声。
本发明为音频降噪和处理提供一种技术方案,通过对采集的音频进行相位消除的方式来对目标音频进行数字降噪,该技术方案能够广泛应用在智能家居领域,通过此技术手段,可以在复杂环境下将使用者的声音(人声)提取出来,进行进一步的语义分析,从而实现精准人机对话。
附图说明
图1本发明中模拟音频信号转换为数字序列示意图。
图2本发明中相位消除除噪示意图。
图3本发明实施例中音频信号转换为数值序列的示意图。
具体实施方式
目前常用的数字音频采样率为48KHz,通常适用于miniDV、数字电视、DVD、DAT、电影和专业音频领域,可满足绝大部分需要。但对于音频信号分析来说,还略有欠缺。当采集的音频信号带宽不到采样频率的一半(即奈奎斯特频率),那么此时这些离散的采样点能够完全表示原信号。高于或处于奈奎斯特频率的频率分量会导致混叠现象,这将使不同声音信号的分辨和处理工作变得非常困难。采样频率必须大于被采样信号带宽的两倍,如果信号的带宽是100Hz,那么为了避免混叠现象采样频率必须大于200Hz,也就是采样频率必须至少是信号中最大频率分量频率的两倍,否则就不能从信号采样中恢复原始信号。使用拥有96KHz或更高采样率能力芯片能够更好地将音频信号进行还原,从而更好地还原采集到的音频信号。
本发明通过使用超高采样率的芯片,对音频的采样和处理,将抑噪音频信号与源噪音信号进行相位消除,从而达到降噪效果,实现音源分离和提取的目的。
首先,由系统麦克风接收到噪音的模拟信号,通过采样芯片(96KHz或更高)将模拟信号进行采样,得出一系列在时间上离散的样值,即样值序列。对每个样值进行离散化处理,将其转换为有限个离散值,完成模拟信号到数字信号的转变;噪音信号变为数字信号后,通过算法计算将数字信号转换为数值序列,将该数值序列进行二次计算,获得与该信号频谱相同、相位相差180°的降噪信号的数字序列(抑噪信号),再使用算法将抑噪信号数字序列反向还原成模拟信号,将该抑噪信号与外置麦克风采集的音源的音频信号混合,抑噪信号与噪音信号互相抵消,从而获取到清晰、无干扰的语音指令。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海百芝龙网络科技有限公司,未经上海百芝龙网络科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201611195815.5/2.html,转载请声明来源钻瓜专利网。