[发明专利]基于分类器融合的汉语方言自动辨识方法无效
申请号: | 201310416173.7 | 申请日: | 2013-09-12 |
公开(公告)号: | CN103474061A | 公开(公告)日: | 2013-12-25 |
发明(设计)人: | 朱贺;高红民;王慧斌 | 申请(专利权)人: | 河海大学 |
主分类号: | G10L15/02 | 分类号: | G10L15/02;G10L15/18 |
代理公司: | 南京苏高专利商标事务所(普通合伙) 32204 | 代理人: | 李玉平 |
地址: | 211100 江*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 分类 融合 汉语 方言 自动 辨识 方法 | ||
技术领域
本发明涉及多分类器融合技术的语音辨识方法,尤其涉及一种汉语方言辨识方法,属于语音信号处理领域。
背景技术
汉语方言自动辨识是利用计算机分析一段输入的语音,判别说话人所属方言区域的语音处理技术。在我国这样一个多民族、多方言的国家,汉语方言自动辩识的研究为我国各民族间的无障碍沟通建立了基础,随着我国科学技术的快速发展,其中更是酝酿着巨大的应用价值和广阔的应用前景。作为语音识别研究的一个分支,在早期的研究中,汉语方言辨识系统往往采用单分类器单特征的设计策略,忽视了信息融合在系统设计中的应用,使得系统完全依赖于某一分类器和某一特征,制约了系统性能的提高。
多信息融合是目前信息处理研究领域的热点,它不仅可以更加全面、详细地描述客观现象,还能实现深层信息的挖掘。在语音处理领域,信息融合方式主要采用两种方式:一、多特征融合;二、多分类器融合。前者采用多特征-单分类器的设计策略,通过不同特征得分的加权和,使得一个系统中同时使用多个特征,从而提供更高正确率的决策;而后者则采用多分类器的设计策略,将具有互补性的分类器融合到一个系统中,通过不同分类器在分类策略上的差异实现多重分类并融合分类结果。在相应的分类器融合的研究中,目前多是针对与文本相关的语音识别,而能够适应与文本无关语音识别的融合机制并不多见。
发明内容
发明目的:针对现有技术中存在的问题,本发明以两级分类器为框架,提出了一套新分类器融合机制,具体是一种基于分类器融合的汉语方言自动辨识方法。本发明可以更好的提取类汉语方言语音特征间差异信息,并且更加适应与文本无关的方言、语种识别等识别系统,显著提高分类能力和鲁棒性。
在分类器融合中,融合系统的性能主要取决于以下两点:一、分类器的选取;二、融合机制的设计。在分类器的选取上,通常要求多分类器在分类策略上具有互补性,从而在融合后实现置信度更高的决策。鉴于此,本文选用生成式分类器高斯混合模型(GMM)和判决式分类器支撑矢量机(SVM)为融合对象。作为生成式分类器,GMM具有较好的数据拟合能力,能够较好的描述整体数据的分布状态。但是,由于需要从完备的数据中学习参量,对于训练集的数据量要求过高且训练周期较长。相比较,SVM不具备较好的数据分布的拟合能力但能够较为清晰的描述分类面的状态。因此,GMM和SVM在原理上具有互补性将其融合可以发挥两种分类器的优势。对于融合机制的设计可以采取后端分数融合和多级融合两种方式。前者对SVM的决策进行置信度打分,并将其与GMM的打分进行加权求,以此进行类别决策;后者将GMM作为分类矢量的生成器,生成含有全局信息的分类矢量并送入SVM进行分类。在方言识别中由于数据的分布状态过于复杂且数据量过于庞大,不宜使用SVM对原始语音特征进行分类和打分,此外在分数融合中权重的选择也有一定的难度,因此,多级分类器融合系统更加适应于汉语方言辨识研究。传统基于GMM、SVM的两级分类器融合通常采用Fisher核函数作为融合机制,在所提取的特征中不仅含有方言语音的声学信息也含有该方言的全局信息,是一种高级的分类矢量。但是,其中也存在着诸多局限。首先,Fisher核函数的映射空间存在着维数灾难的隐患,很难满足大数据量的与文本无关的语音识别。其次,对于同一语音基元,不同方言模型的打分间有一定的相关性,如表1所示,而种相关性影响了分类矢量的类代表性。最后,对于方言辨识,我们期望分类特征体现出方言的类间差异,即不同方言模型对一段语音打分间的差异性。
表.1不同方言模型对语音基元的打分
技术方案:一种基于分类器融合的汉语方言自动辨识方法,选用生成式分类器高斯混合模型(GMM)和判决式分类器支撑矢量机(SVM)为融合对象,生成式分类器高斯混合模型是生成式概率统计模型,其概率密度计算公式为:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于河海大学,未经河海大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201310416173.7/2.html,转载请声明来源钻瓜专利网。
- 上一篇:语音辨识系统以及方法
- 下一篇:一种用于LED显示屏信号无线同步传输的系统