[发明专利]语音质量监控的方法和装置有效
申请号: | 201210375963.0 | 申请日: | 2012-09-29 |
公开(公告)号: | CN103716470A | 公开(公告)日: | 2014-04-09 |
发明(设计)人: | 肖玮;马付伟;许丽净 | 申请(专利权)人: | 华为技术有限公司 |
主分类号: | H04M3/22 | 分类号: | H04M3/22;G10L25/60 |
代理公司: | 北京龙双利达知识产权代理有限公司 11329 | 代理人: | 王君;肖鹂 |
地址: | 518129 广东*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 语音 质量 监控 方法 装置 | ||
技术领域
本发明涉及音频技术领域,更具体地涉及语音质量监控的方法和装置。
背景技术
在音频技术研究领域,应用户或技术供应方的需求,需要反映相关音频技术的好与坏,也就是需要进行语音质量监控,并输出质量评估结果。
然而,基于不同技术的质量评估方法或装置存在如下问题。例如,对于待评估的音频信号有长度要求,例如不超过20秒。或者,对于较长的待评估的音频信号需要一次性输入,增加了评估装置的硬件成本。这些问题使得如何使用较低的成本,对较长的音频信号进行合理的语音质量监控成为一个难题。
发明内容
有鉴于此,本发明实施例提供一种语音质量监控的方法和装置,以解决使用较低的成本,对较长的音频信号进行合理的语音质量监控的难题。
第一方面,提供了一种语音质量监控的方法,包括:从输入的信号中截取一个或多个语音信号段;对每个语音信号段进行语段分割,获得一个或多个语段;对语段进行语音质量评估,根据语音质量评估获得质量评估结果。
在第一种可能的实现方式中,根据语音活跃度对每个所述语音信号段进行语段分割,获得一个或多个语段,所述语音活跃度表示语音信号段中每一帧语音信号的活跃性;或将每个所述语音信号段进行分段,获得一个或多个语段,每个语段的长度等于一个固定时长。
结合第一方面的第一种可能的实现方式,在第二种可能的实现方式中,分析语音信号段每帧的语音活跃度,连续的活跃帧作为一个语段,将语音信号段分割成一个或多个语段。
结合第一方面的第一种可能的实现方式,在第三种可能的实现方式中,分析语音信号段每帧的语音活跃度,连续的活跃帧作为一个语段,将语音信号段分割成一个或多个语段;确定分割后相邻的两个语段的状态切换点之间的时长T;将时长T与门限阈值比较,根据比较结果,调整两个语段的各自时长,获得调整时长后的语段,对语段进行语音质量评估包括:对调整时长后的语段进行质量评估。
结合第一方面的第三种可能的实现方式,在第四种可能的实现方式中,当时长T大于门限阈值时,将前一个语段的结束位置由原状态切换点向后延长0.5倍门限阈值;将后一个语段的开始位置由原状态切换点向前延长0.5倍门限阈值;或当时长T小于等于门限阈值时,将前一个语段的结束位置由原状态切换点延长0.5*T时长;将后一个语段的开始位置由原状态切换点向前延长0.5*T时长。
结合第一方面或第一方面的上述可能的实现方式,在第五种可能的实现方式中,以单位时间对输入的信号进行分割,获得多个单位时间的输入的信号;通过分析单位时间的输入的信号,确定单位时间的输入的信号为语音信号或非语音信号;将确定为语音信号的单位时间的输入的信号作为语音信号段。
结合第一方面或第一方面的上述可能的实现方式,在第六种可能的实现方式中,对语段进行非侵入式质量评估,获得质量评估结果。
第二方面,提供了一种语音质量检测的装置,包括分类单元、语段分割单元、质量评估单元:信号分类单元用于从输入的信号中截取一个或多个语音信号段,并发送到语段分割单元;语段分割单元用于对从信号分类单元接收的每个语音信号段进行语段分割,获得一个或多个语段,并发送到质量评估单元;质量评估单元用于对从语段分割单元接收的语段进行语音质量评估,根据语音质量评估获得质量评估结果。
在第一种可能的实现方式中,语段分割单元用于根据语音活跃度对每个语音信号段进行语段分割,获得一个或多个语段,所述语音活跃度表示语音信号段中每一帧语音信号的活跃性;或语段分割单元,用于将每个语音信号段进行分段,获得一个或多个语段,每个语段的长度等于一个固定时长。
结合第二方面的第一种可能的实现方式,在第二种可能的实现方式中,语段分割单元包括:语音活跃度检测单元,语音活跃度检测单元用于分析语音信号段每帧的语音活跃度,连续的活跃帧作为一个语段,将语音信号段分割成一个或多个语段。
结合第二方面的第一种可能的实现方式,在第三种可能的实现方式中,语段分割单元包括语音活跃度检测单元和时长确定单元:语音活跃度检测单元用于分析语音信号段每帧的语音活跃度,连续的活跃帧作为一个语段,将语音信号段分割成一个或多个语段;时长确定单元用于确定相邻的两个语段的状态切换点之间的时长T;将时长T与门限阈值比较,根据比较结果,调整两个语段的各自时长,获得调整时长后的语段,并将调整时长后的语段发送给质量评估单元;质量评估单元,用于对时长确定单元调整时长后的语段进行语音质量评估,根据语音质量评估获取质量评估结果。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华为技术有限公司,未经华为技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201210375963.0/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种菠萝果脯的制备方法
- 下一篇:一种节能恒温恒湿试验箱