[发明专利]一种基于语谱图时间差分的语音音节数估计方法在审
申请号: | 201911331869.3 | 申请日: | 2019-12-21 |
公开(公告)号: | CN111063371A | 公开(公告)日: | 2020-04-24 |
发明(设计)人: | 贺前华;苏健彬;严海康;詹俊瑶 | 申请(专利权)人: | 华南理工大学 |
主分类号: | G10L25/87 | 分类号: | G10L25/87;G10L25/30 |
代理公司: | 广州粤高专利商标代理有限公司 44102 | 代理人: | 何淑珍;江裕强 |
地址: | 510640 广*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 语谱图 时间差 语音 音节 估计 方法 | ||
本发明提供了一种基于语谱图时间差分的语音音节数估计方法,所述方法步骤包括:将语音信号的语谱图X,通过一个M阶图像后向平滑滤波器得到模糊形式语谱图Xsupgt;*/supgt;,对其进行N阶时间差分以及M阶图像后向平滑,计算出N阶差分图S;对N阶差分图的每一列进行频率区域选择性求和,以获得初步浊音起始边界统计特征,然后通过该特征以及边界时间间隔限制Gsubgt;1/subgt;得到初步浊音起始边界;使N阶差分图的低频部分与图案P进行局部图案匹配得到其图案特征图Ssupgt;*/supgt;,通过图案特征图计算出匹配浊音起始边界;结合初步浊音起始边界和匹配浊音起始边界,通过一个边界时间间隔限制Gsubgt;2/subgt;,得到最终的浊音起始边界,最后计算出音节数K。本发明具有可解释性,成本低,有着广阔的应用前景。
技术领域
本发明涉及音频处理技术领域,具体涉及一种基于语谱图时间差分的语音音节数估计方法。
背景技术
音节数估计作为语速估计的基础,在情感识别、医学中评估失语症语言流利性等领域有着广阔的应用前景。语速作为情感表达的一种重要的韵律手段,是情感识别中的重要特征。若能精确地估计出单位时间内的音节数,则能提高语速估计的准确度,从而提高情感识别的性能。同时,在基于匹配模型的语音识别中,音节数估计不但可提升匹配速度,而且可以提高识别精度。目前的音节数估计方法可分为两大类,一类是基于人工神经网络(Artificial neural network,ANN)的方法,另一类是基于音节检测的方法。
其中,采用人工神经网络方法(专利:语速估计模型的训练、语速估计方法、装置、设备及介质)需要大量的人工标记数据,会耗费极大的成本,且在训练数据不足时会表现出准确率低、鲁棒性差、识别与说话人相关等缺点。而且人工神经网络缺乏解释性,相当于一个黑匣子,无法在实际应用过程中出现问题时或需要及时调整时做出灵活性变动。因此需要一种具有解释性的、低成本的音节数估计方法。
另一类基于音节检测的方法中,又分为包络检测方法与传统统计模型方法。其中,包络检测方法(双门限算法在藏语语音音节分割中的应用分析卓嘎,2015)通过提取语音信号的幅度包络,利用检测包络的谷点来进行音节边界的检测。这种方法的问题在于:在实际的连续语音信号中,信号的幅度包络中存在非常多的谷点,但并不是所有的谷点都对应音节边界,而目前又缺乏一种准确度高、鲁棒性强的算法来判断某一谷点是否是音节的边界,因此在实际应用过程中仅采取幅度包络这一特征来检测音节很容易出现误差。传统统计模型方法则一般采用GMM或HMM模型(Robust Syllable Segmentation and its Applicationto Syllable centric Continuous Speech Recognition.2010),与ANN方法相同,此类方法也需要大量人工标注的数据,同时有研究表明GMM或HMM模型在一般问题上的性能要比ANN方法差。
对于上述的方法中,虽然基于ANN的算法一般能取得比较好的音节数估计结果,但其高昂的成本使实际应用变得十分困难。而基于音节检测的方法虽然实现了低成本,但其效果还没有达到能实际应用的水平。基于上述缺点可知现有技术难以满足实际需求的问题。
发明内容
为了克服现有技术的不足,本发明提出了一种基于语谱图时间差分的语音音节数估计方法。利用语谱图中浊音起始边界比较明显的特征,通过图像后向平滑以及时间差分得出语谱图在时间上的动态信息,从而得到浊音起始边界,进而得到语音音节数的估计值。
本发明的目的至少通过如下技术方案之一实现。
一种基于语谱图时间差分的语音音节数估计方法,包括以下步骤:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华南理工大学,未经华南理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201911331869.3/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种气动热铆枪
- 下一篇:一种实现并联场效应管主动均流的电路结构