[发明专利]口型辅助语音识别术在车载导航中应用的方法及系统无效
申请号: | 201110239403.8 | 申请日: | 2011-08-19 |
公开(公告)号: | CN102324035A | 公开(公告)日: | 2012-01-18 |
发明(设计)人: | 伍栋杨;王冰 | 申请(专利权)人: | 广东好帮手电子科技股份有限公司 |
主分类号: | G06K9/62 | 分类号: | G06K9/62;G10L15/02;G10L15/06 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 528100 广*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 口型 辅助 语音 识别 车载 导航 应用 方法 系统 | ||
技术领域
本发明涉及车载语音导航领域,尤其涉及一种口型辅助语音识别术在车载影音导航中的应用方法及系统。
背景技术
语音识别技术随着计算机和相关软硬件技术的发展,已越来越多的应用在各个领域,其识别率也在不断的提高。在环境安静、发音标准等特定条件下,目前应用在语音识别输入文字系统的识别率已经达到95%以上。但如果在车上或外界噪声干扰比较大、发音不标准的情况下,其识别率将大打折扣,以至于无法达到实用目的。若能采用其它方法来辅助判断以提高其语音识别的准确率,那么语音识别的实用性将显著提高。
人类的语言认知过程是一个多通道的感知过程。在人与人日常交流的过程中,通过声音来感知他人讲话的内容,在喧闹的环境或对方发音模糊不清时,还需要眼睛观察其口型,表情等的变化,才能准确地理解对方所讲的内容。现行的语音识别系统忽略了语言感知的视觉特性这一面,仅仅利用了单一的听觉特性,使得现有的语音识别系统在噪声环境或多话者条件下,其识别率都显著下降,降低了语音识别的实用性,应用范围也受限制。
随着车载导航系统的普及应用,驾驶员在驾驶车辆时进行车载导航系统各项应用功能的操控,仅用按键和触摸操控还是不够方便,而且操控时由于分心驾驶,很容易引起行车事故。用语音识别方式进行操控来解决这个问题,但目前采用语音操控技术的导航系统使用在环境噪声比较严重的车上,其正确识别率低,影响精确操控,效果不够理想。
发明内容
本发明的目的在于:解决车载导航系统在车辆正常行驶或怠速时的噪声环境中的语音识别率低的问题。
为解决上述问题,本发明提出的方案是:利用人类语言多通道感知特性,利用传感器模拟“听觉”和 “视觉”,采用口型识别技术辅助语音识别,提高车载导航系统在噪声环境中的语音识别率。实施过程是:通过传感器对声音和口型图像变化系列获取“听觉”和 “视觉”信息,经过去噪、A/D转换等一系列处理后,分别与预设预设在图像/语音识别处理模块中的模板库数据比对进行语音识别口型识别,用口型识别结果与语音识别结果进行对比,若两者结果相似性达到一定程度,即可以确认语音识别结果,从而克服噪音的影响,显著提高了语音识别率,再把结果转化成相关指令输出到车载导航系统进行导航或获取信息。
本发明方案如图1所示实现方法:系统首先分别对语音输入和口形图像输入进行预处理后,进行特征提取,“训练”“模板块”作识别匹配用。使用时再分别对语音输入和口形图像输入进行预处理后,进行特征提取,获取“测试”信号,结合经过训练的模板块进行“测量估计”,确认语音识别的有效信息,再与预置“专家知识”系统进行识别判断后,输出 “结果”,完成语音识别过程。
特别说明的是训练模板块时,通过录音和摄像进行模板训练,建立语音和口型识别的模板库,在录音的同时将口型视频图像做一一对应判断存储。
本发明的语音识别采用模板匹配的方法,该方法共四个步骤:特征提取、模板训练、模板分类、判决。
以声音识别为例:
第一步是特征提取,将采集的各种语音的模拟信号进行A/D转换,转换成数字信号后进行加工并存储。即将该信号数字进行数字去噪处理加工,去除伪数据,保留特征数据。采用的去噪处理方法是根据车内环境噪声的特点,分析出车在正常行驶或怠速时的常态噪声,如关闭或开启车窗时的发动机、空调及行车噪声特征数据,将采集的原始语音数据通过相关运算,去除这些噪声特征数据后形成接近真实的语音特征数据。
第二步是模板训练,根据车载设备操控常用语音命令和相关信息建立语音模板库,如“开始”、“导航”、“目的地”、“上海”等语音,找不同年龄、性别、口音的人来读,并做相应的处理,建立起车用操控语音模板数据库。
第三步是模板分类,根据应用特征分为控制命令类、地址信息类,信息范围按大小类分类,以缩小匹配判定范围,提高匹配效率和准确率。控制命令类具体有如导航命令类、语音控制类;地址信息大小类具体有如省级地名、市级地名或更小地名等。
第四步是判定,利用匹配算法进行语音特征与语音模板库模型匹配,将判定的结果与口型识别比对,进一步确认语音识别结果的准确性。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于广东好帮手电子科技股份有限公司,未经广东好帮手电子科技股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201110239403.8/2.html,转载请声明来源钻瓜专利网。
- 上一篇:高楼自救装置
- 下一篇:一种复合型箱磨式液力偶合器