[发明专利]用于评估退化语音信号的可理解性的方法和装置在审
申请号: | 201380069674.0 | 申请日: | 2013-11-15 |
公开(公告)号: | CN104919525A | 公开(公告)日: | 2015-09-16 |
发明(设计)人: | 约翰·杰勒德·贝伦茨 | 申请(专利权)人: | 荷兰应用自然科学研究组织TNO |
主分类号: | G10L25/69 | 分类号: | G10L25/69;G10L25/21 |
代理公司: | 北京德琦知识产权代理有限公司 11018 | 代理人: | 康泉;宋志强 |
地址: | 荷兰*** | 国省代码: | 荷兰;NL |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 用于 评估 退化 语音 信号 可理解 方法 装置 | ||
1.一种通过将参考语音信号传送通过音频传输系统以提供退化语音信号,评估从所述音频传输系统接收的所述退化语音信号的可理解性的方法,其中所述参考语音信号表达由辅音和元音的组合构成的一个或多个词,其中所述方法包括:
将所述参考语音信号采样成多个参考信号帧,将所述退化语音信号采样成多个退化信号帧,并且通过将所述参考信号帧与所述退化信号帧彼此关联来形成帧对;
向每个帧对提供表示所述退化信号帧和关联的所述参考信号帧之间的差的差分函数;
针对一个或多个干扰类型,补偿所述差分函数,以向每个帧对提供适合于人听觉感知模型的干扰密度函数;
根据多个帧对的所述干扰密度函数导出总体质量参数,所述质量参数至少指示所述退化语音信号的所述可理解性;
其中,所述方法进一步包括以下步骤:
针对由所述参考语音信号表达的所述词中的至少一个词,识别与所述至少一个词的至少一个辅音关联的参考信号部分和退化信号部分;
根据所识别的参考信号部分和退化信号部分,基于所述退化信号部分的信号功率和所述参考信号部分的信号功率的比较,确定所述退化语音信号的干扰的程度;以及
依据所确定的与所述至少一个辅音关联的所述退化语音信号的干扰的程度,补偿所述总体质量参数,以将所述总体质量参数补偿用于与所述退化语音信号中的辅音一致的干扰。
2.根据权利要求1所述的方法,其中所述识别步骤是基于所述参考语音信号的信号功率执行的。
3.根据权利要求1或权利要求2所述的方法,其中所述识别步骤包括将多个参考信号帧中每个参考信号帧的信号功率与第一阈值和第二阈值相比较,并且如果所述信号功率大于所述第一阈值并且小于所述第二阈值,则认为所述参考信号帧中的一个或多个参考信号帧与所述至少一个辅音关联。
4.根据前述权利要求中任一项所述的方法,其中所述识别步骤包括:在识别所述参考信号部分之后,通过执行与关联于所述至少一个辅音的所述参考信号部分的参考信号帧的时间对准或者通过选择包含与所述至少一个辅音关联的参考信号帧的帧对,选择与所述至少一个辅音关联的一个或多个退化信号帧。
5.根据前述权利要求中任一项所述的方法,其中所述退化信号帧的信号功率是在第一频域内计算的,并且所述参考信号帧的信号功率是在第二频域内计算的,所述第一频域包括说话声音和可听噪声的第一频率范围,优选地在300Hz至8000Hz之间,并且所述第二频域包括说话声音的第二频率范围,优选地在300Hz至3500Hz之间。
6.根据前述权利要求中任一项所述的方法,其中所述识别步骤包括:
针对所述参考语音信号,识别信号功率在第一阈值和第二阈值之间的活跃语音信号帧,以及信号功率在第三阈值和第四阈值之间的轻柔语音信号帧,并且将所述活跃语音信号帧和所述轻柔语音信号帧与退化信号帧关联,以产生活跃语音参考信号帧、轻柔语音参考信号帧、活跃语音退化信号帧和轻柔语音退化信号帧;并且
其中信号功率的所述比较包括将所述活跃语音参考信号帧的信号功率、所述轻柔语音参考信号帧的信号功率、所述活跃语音退化信号帧的信号功率和所述轻柔语音退化信号帧的信号功率彼此比较。
7.根据权利要求6所述的方法,其中所述第一阈值小于所述第三阈值,所述第三阈值小于所述第四阈值,并且所述第四阈值小于所述第二阈值。
8.根据权利要求7所述的方法,其中选择所述第二阈值,以排除与一个或多个元音关联的参考信号帧或退化信号帧。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于荷兰应用自然科学研究组织TNO,未经荷兰应用自然科学研究组织TNO许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201380069674.0/1.html,转载请声明来源钻瓜专利网。
- 上一篇:用于核部件的带屏蔽迁移的方法和装置
- 下一篇:显示装置