[发明专利]连续二次贝氏分类法辨认相似国语单音的方法及装置无效

专利信息
申请号: 200710080272.7 申请日: 2007-02-15
公开(公告)号: CN101246686A 公开(公告)日: 2008-08-20
发明(设计)人: 黎自奋 申请(专利权)人: 黎自奋;李台珍;廖丽娟
主分类号: G10L15/00 分类号: G10L15/00;G10L15/02;G10L15/06;G10L15/08;G10L19/12
代理公司: 北京集佳知识产权代理有限公司 代理人: 逯长明
地址: 中国台湾台*** 国省代码: 中国台湾;71
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 连续 二次 分类法 辨认 相似 国语 单音 方法 装置
【说明书】:

技术领域

国语相同或相似单音非常多,造成辨认单音困难,尤其男女发音及发音时生理、心理状态不同,同一单音,发出声音,变化差异很大,还有省籍及各地人发音的声调,即使同一单音,会发出很多不同相似单音。本发明是将未知单音的相似已知声音,用连续二次贝氏分类法,在相似已知单音中,找出真正未知单音。详细地说,本发明语音辨认系统包含E个等长的弹性框,没有滤波器,不重叠,框住长短不等的单音音波,将音波正常化并转换成E个线性预估编码倒频谱(LPCC)向量。先用简易贝氏分类法(Bayes decision rule)找出未知单音的M个最相似已知单音。再用精密贝氏分类法将未知单音从M个已知相似单音找出。音波正常化及抽取特征简单、省时,辨认快又准确,辨认范围广,发音快慢均可用弹性框正常化后辨认。

背景技术

单音发音时,它的发音用音波表示。音波是一种随时间作非线性变化的系统,一个单音音波内含有一种动态特性,也随时间作非线性连续变化。相同单音发音时,有一连串相同动态特性,随时间作非线性伸展及收缩,但相同动态特性依时间排列秩序一样,但时间不同。相同单音发音时,将相同的动态特性排列在同一时间位置上非常困难。更因相似单音特多,造成辨认更难。

一个计算机化语言辨认系统,首先要抽取声波有关语言信息,也即动态特性,过滤和语言无关的杂音,如人的音色、音调,说话时心理及生理及情绪和语音辨认无关先删去。然后再将相同单音的相同特征排列在相同的时间位置上。此一连串的特征用一等长系列特征向量表示,称为一个单音的特征模型。目前语音辨认系统要产生大小一致的特征模型太复杂,且费时。相同单音的相同特征很难排列在同一时间位置上,导致比对辨认困难。

一般语音辨认系统有三个主要工作:抽取特征,特征正常化(特征模型大小一致,且相同单音的相同特征排列在同一时间位置)及未知单音辨认。一个单音声波特征常用有下列几种:能量(energy),零横过点数(zerocrossings),极值数目(extreme count),颠峰(formants),线性预估编码倒频谱(LPCC)及梅尔频率倒频谱(MFCC),其中以LPCC及MFCC是最有效,并普遍使用。LPCC是代表一个单音最可靠,稳定又准确的语言特征。它用线性回归模式代表单音音波,以最小平方估计法计算回归系数,其估计值再转换成倒频谱,就成为LPCC。而MFCC是将音波用傅氏转换法转换成频率。再根据梅尔频率比例去估计听觉系统。根据学者[6]用动态时间扭曲法(DTW),MFCC特征比LPCC特征辨认率要高。但经过多次语音辨认实验(包含本人前发明),用贝氏分类法,LPCC特征辨认率比MFCC特征要高,且省时。

至于语言辨认,已有很多方法采用。有动态时间扭曲法(dynamictime-warping),向量量化法(vector quantization)及隐藏式马可夫模式法(HMM)。如果相同的发音在时间上的变化有差异,一面比对,一面将相同特征拉到同一时间位置。辨认率会很好,但将相同特征拉到同一位置很困难并扭曲时间太长,不能应用。向量量化法如辨认大量单音,不但不准确,且费时。最近HMM辨认方法不错,但方法繁杂,太多未知参数需估计,计算估计值及辨认费时。最近用贝氏分类法[2],以相同数据库,将各种长短一系列LPCC向量压缩成相同大小的分类模型,辨认结果比HMM方法好[2,5],但压缩过程复杂费时,且相同单音很难将相同特征压缩到相同时间位置,对于相似单音,很难辨认。

本发明语音辨认系统针对上述缺点,从学理方面,根据音波有一种语音特征,随时间作非线性变化,自然导出一套抽取语音特征方法。将一个单音音波先正常化再转换成一个足以代表该单音的大小相等特征模型,并且相同单音在它们特征模型内相同时间位置有相同特征。不需要人为或实验调节系统内的未知参数及门坎。用简易贝氏分类法,即可将未知单音分类模型和数据库内已知单音标准模型比对,不需要再压缩,扭曲或寻找相同的特征来比对。所以本发明语音辨认系统,能快速完成特征抽取,特征正常化及辨认。本系统为了提高单音辨认率,连续用二次贝氏分类法将很难辨认的相似单音辨认出来,大大提高整体国语单音辨识率。辨认率高,应用广,用弹性框可以辨认极短或极长单音音波,对英语极短音节辨认也有效。

发明内容

(1)本发明提供一种语音辨认方法及装置。它能将不具语音音波删除。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于黎自奋;李台珍;廖丽娟,未经黎自奋;李台珍;廖丽娟许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/200710080272.7/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top