[发明专利]一种适用于混响环境的汉语语音清晰度评测算法在审
申请号: | 201611014116.6 | 申请日: | 2016-11-17 |
公开(公告)号: | CN106782611A | 公开(公告)日: | 2017-05-31 |
发明(设计)人: | 章斯宇;孟子厚 | 申请(专利权)人: | 中国传媒大学 |
主分类号: | G10L25/60 | 分类号: | G10L25/60;G10L25/90;G10L25/93 |
代理公司: | 北京志霖恒远知识产权代理事务所(普通合伙)11435 | 代理人: | 陈姗姗 |
地址: | 100024 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 适用于 混响 环境 汉语 语音 清晰度 评测 算法 | ||
技术领域
本发明属于声频测量领域,特别涉及一种适用于混响环境的汉语语音清晰度客观评测算法。
背景技术
语音清晰度是衡量语音传输系统性能优劣的重要评价指标,清晰度评测在通信、扩声、音质设计等领域广泛应用,一般用正确接收的语言单位(比如单音节)与全部发送语言单位的比值度量清晰度。清晰度的评测方法分为主观评测和客观评测两类,主观评测方法是组织人员进行现场清晰度测试打分,尽管主观评测结果直接准确,但实际操作困难,因此工程中更多采用客观评测方法。清晰度客观评测是用某个客观量评价系统的清晰度,这个客观量是根据一定的计算模型计算得到的,并且是与主观评测结果高度相关的。声频技术领域使用的语音清晰度客观评测指标主要有:清晰度指数AI(Articulation Index),辅音损失率%Alcon(Articulation loss of consonant),语言传输指数STI(Speech Transmission Index)等,这些客观评测方法均有其各自的计算模型,采用不同的信号处理方法,适用于不同的条件和场合。然而,将这些评测方法直接应用到汉语声传播环境的清晰度评测时会出现失效的问题,即客观评测结果与汉语语音清晰度主观测试结果不匹配,客观评测结果较差对应的汉语实际听闻感受可能尚可,而客观评测结果较好对应的汉语实际听感可能不佳。
分析现有技术评测汉语语音清晰度失效原因可知清晰度客观评测算法的可靠性与评测对象自身的特性有关,现有的清晰度客观评测方法是根据荷兰语或英语等印欧语系语言特性提出的,并没有考虑汉语的语音学和语言学特性。汉语属于汉藏语系,是一种声调语言,声调起到辨义作用,汉语以单音节为主,一个汉字就是一个单音节,每个音节包含声母、韵母和声调三个部分,有别于传统辅-元-辅的音节构造,由于存在较多的同音字,汉语的单字可以视作无语义,这些语音特点都与外语存在显著区别,因此在语音传输过程中各干扰要素对汉语语音清晰度的影响结果与外语会有所不同。此外,传统的清晰度客观评测算法是将语音传输系统视作一个整体,馈给系统一个标准测试信号,根据系统的输出信号相对输入信号的变化衰减程度,进而给出一个具体的客观量值,计算过程中不涉及传输系统中干扰因素的声学属性,因此不能反映传输系统的声学特性是如何导致语音清晰度的下降,评测结果难以对清晰度降低的原因起到“诊断”和“治疗”作用,无法指导声传输系统的功能设计。语音传输过程中影响清晰度的声学因素有很多,其中混响是一类主要的干扰条件,如果房间吸声或反射面处理不当,混响作用下语音信号的直达声和混响声混叠导致接收端清晰度下降。目前并没有专门针对混响环境的并且考虑了汉语语音学和与语言学特性的清晰度评测方法。
发明内容
本发明给出了一种适用于纯混响环境的汉语听感清晰度客观评测方法,建立了以混响时间为自变量的汉语单音节、声母、韵母和声调清晰度的客观评测模型。只需要测量传输系统的混响时间就可以直接计算出相应的汉语语音清晰度值,该方法针对汉语的语音学和听感特性,适用于汉语传播为主的声传输系统,同时计算结果还可以对传输系统的混响条件设置起到一定的指导作用。
提出了一种适用于混响环境的汉语语音清晰度客观评测算法,包括测量能够表征影响汉语语音清晰度的混响条件下的客观声学参数的步骤,其特征在于,根据所建立的客观声学参数与汉语的主观听感清晰度间的对应函数关系,得到当前传输带宽有限条件下的汉语语音清晰度,其中,客观声学参数为自变量;其中,混响时间T对应混响条件下的客观声学参数。
给出了在混响条件下的汉语单音节清晰度QF与混响时间T之间的函数关系
进一步给出了在混响条件下的汉语声母清晰度QFsm、韵母清晰度QFsm及声调清晰度QFsd与混响时间T之间的函数。
附图说明
图1为混响条件下汉语语音清晰度主观听感实验示意图
图2为汉语单音节、声母、韵母和声调清晰度与混响时间的关系图
图3为混响环境中汉语语音清晰度实测值与预测值的误差表示图
具体实施方式
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国传媒大学,未经中国传媒大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201611014116.6/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种音频会议的音质测试方法
- 下一篇:一种逆向爆音检测方法及其装置