[发明专利]一种移动手机特定连续语音过滤方法及过滤装置在审
申请号: | 201410112404.X | 申请日: | 2014-03-25 |
公开(公告)号: | CN103871417A | 公开(公告)日: | 2014-06-18 |
发明(设计)人: | 汪金辉;龙哲华;侯立刚;耿淑琴;彭晓宏;宫娜 | 申请(专利权)人: | 北京工业大学 |
主分类号: | G10L21/007 | 分类号: | G10L21/007;G10L21/0232;H04M1/725 |
代理公司: | 北京思海天达知识产权代理有限公司 11203 | 代理人: | 纪佳 |
地址: | 100124 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 移动 手机 特定 连续 语音 过滤 方法 装置 | ||
技术领域
本发明涉及一种用于移动手机通话识别特定人的连续语音的过滤方法及过滤装置,适用于语音降噪,滤除非目标语音,属于语音通讯技术领域。
背景技术
语音识别技术自诞生以来就对人类的生活方式产生了深远的影响,因此语音识别技术一直以来都是世界各地学者们深入研究的热点。目前语音识别广泛采用动态时间规整(DTW)技术和基于概率统计原理的隐马尔可夫模型(HMM)技术。语音是一个复杂的非线性过程,因此基于非线性理论,具有自适应性、并行性、鲁棒性、容错性和学习性等特点的人工神经网络技术逐渐成为时下语音识别新的研究方向。如今的移动通话,已成为人们生活必不可少的一部分,但是通话环境对于我们的通话质量影响非常明显,尤其在一个特别嘈杂的环境,但需要通话的情况下,移动手机的一个识别特定人的连续语音的功能,就会给用户一个极好的用户体验,是一个被广大用户需要的功能。
语音识别的层次模型和系统模型上分析语音识别的基本原理。语音预处理的整个流程,包括对原始语音信号的采集、预加重、分帧加窗、端点检测和不同语音特征值的获取。移动设备的特定语音识别有着广泛的应用前景和商业价值。鉴于语音识别的重要性,各国都把其当作本国的一个重点项目投入重金加以研究。然而语音信号的声学特征极其复杂,不同国家的人们语言各不相同,同一个国家之间又存在方言的差异,即使是同一个人在不同环境下,不同心里因素下都可能造成语音特征的波动。在语音识别的研究过程中不可避免的会遇到诸多困难,这主要表现在以下几个方面上
(1)噪声的干扰
语音识别系统在最初开发的时候往往是在相对安静的环境下进行,而在实际投入使用的时候,其周围环境往往是难以预料的。在有噪声干扰的情况下,系统识别率往往会受到巨大影响,主要是因为此时系统捕获的声音会发生很大的变化即发生所谓的Lombard效应。目前常采用抑制噪声的方法来进行去噪,主要技术有:环境规整术、建立噪声模型、谱减法和修正识别器模型使之适合噪声
(2)语音信号本身的复杂性和多变性
由于世界各地的人们使用不同的语音,而同一个国家内部又存在着众多的方言,这都对语音特征参数的研究提出了巨大的挑战,因此目前很难实现一个对各种语音能够完全通用的语音识别系统。即便是同一个人在不同时间所说的同一个语音都不是完全一致的,因此语音信号自身的复杂和多变性也制约着语音识别的进一步发展。
(3)语音系统的复杂性
语音识别系统是一项及其复杂的工程,它涉及到众多领域的学科,像语音声学、人工智能学、模式识别、数理统计学、通信学、计算机科学甚至心理学。因此如果这些学科得不到快速的发展,出现了所谓的瓶颈,最终也会制约着语音识别向更高的方向发展。
综上所述,语音识别技术虽然还有一些技术没有很好得到解决,但是语音识别的应用在近年来呈现出较大的增长需求,如在安全领域,相关部门结合相关业务提出了相应的需求;在教育领域,大人群的普通话水平测试与口语评估迫切需要客观的、自动的评估技术;在电信领域,国内外语音识别技术和部门进入了中国市场;在手机、汽车导航等嵌入式市场,对语音识别技术需求也日益增长;在人机交互领域,语音伴侣、移动终端的语音搜索等得到广泛的应用。因此,语音识别技术作为非常重要的人机交互的技术,有着非常广阔的应用领域和市场前景。
发明内容
本发明目的在于提供一种用于移动手机通话识别特定人的连续语音的过滤技术,尤其在嘈杂的环境下通话,可以有效的解决在这种环境下通话的不便性,同时保护用户隐私方面同样有着很广泛的适用性。该移动手机通话特定连续语音识别系统包括:语音信号接受单元、语音信号预处理单元、提取语音信号基音频率单元、基音频率配比单元、语音基音频率库、语音信号输出单元。语音信号接收单元用于检测到语音信号,接受并输入到本发明模块信号链路;语音信号与处理单元用于保证系统获得一个比较理想的对象;提取语音信号特征单元用于提取进入手机的所有语音基音频率;基音频率配比单元用于将已有在语音库里的基音频率和提取到的基音频率进行比较,并把不匹配的基音频率过滤,留下配比成功的基音频率;语音基音频率库,是事先由用户进行语音训练生成的用户特定语音参数的库,用来和通话时进入手机的语音进行配比;语音信号输出单元用于把最终得到的目标语音发送到手机的通信模块。
为了实现上述目的,本发明采用的技术方案如下:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京工业大学,未经北京工业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201410112404.X/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种带能量利用机构的粘弹性阻尼器
- 下一篇:一种园林雨水排出装置