[发明专利]音频质量综合评测方法及系统有效
申请号: | 201811368468.0 | 申请日: | 2018-11-16 |
公开(公告)号: | CN109147765B | 公开(公告)日: | 2021-09-03 |
发明(设计)人: | 郑抗;李兰影;胡尹;王金钖 | 申请(专利权)人: | 安徽听见科技有限公司 |
主分类号: | G10L15/05 | 分类号: | G10L15/05;G10L15/26;G10L25/60 |
代理公司: | 北京维澳专利代理有限公司 11252 | 代理人: | 王立民;贾博雍 |
地址: | 230001 安徽省合肥市高新区*** | 国省代码: | 安徽;34 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 音频 质量 综合 评测 方法 系统 | ||
1.一种音频质量综合评测方法,其特征在于,包括:
接收待测音频数据;
对所述待测音频数据进行语音识别,得到识别文本;
分别从所述待测音频数据和所述识别文本获取质量评测特征,所述质量评测特征包括声学特征和语义特征;其中,所述语义特征包括语法准确性特征,且获取所述语法准确性特征包括:对识别文本中的语句进行语法修正,得到各语句的字符串编辑距离,计算字符串编辑距离与相应语句的句子长度的比值,将所述比值大于或等于预设比值阈值的语句标记为语法异常语句,将所述语法异常语句的数量占比作为所述语法准确性特征;
利用所述质量评测特征以及预先训练的音频质量评测模型,对所述待测音频数据进行评价,得到音频质量评测结果。
2.根据权利要求1所述的音频质量综合评测方法,其特征在于,
所述分别从所述待测音频数据和所述识别文本获取质量评测特征包括:
从所述待测音频数据中获取所述声学特征,所述声学特征包括:流畅度特征和/或完整性特征;
从所述识别文本中获取语义特征,所述语义特征还包括:语义置信度特征。
3.根据权利要求2所述的音频质量综合评测方法,其特征在于,
从所述待测音频数据中获取所述流畅度特征的方法为:
根据所述待测音频数据的响度异常状态的占比,得到所述流畅度特征;
从所述待测音频数据中获取所述完整性特征的方法为:
根据所述待测音频数据中的异常静音的占比,得到所述完整性特征。
4.根据权利要求3所述的音频质量综合评测方法,其特征在于,
所述根据所述待测音频数据的响度异常状态的占比,得到所述流畅度特征具体包括:
设置固定时长的抽样窗口;
通过所述抽样窗口随机且重复截取所述待测音频数据的响度曲线;
根据每个所述抽样窗口中的响度最大值和响度最低值,计算各所述抽样窗口中的响度差;
将所述响度差大于或等于预设响度阈值的抽样窗口标记为异常窗口;
将所述异常窗口的数量占比作为所述流畅度特征;
所述根据所述待测音频数据中的异常静音的占比,得到所述完整性特征具体包括:
获取所述待测音频数据中的各静音段的持续时长;
将所述持续时长大于或等于预设时长阈值的静音段标记为异常静音段;
将所有异常静音段的持续时长累加,得到异常静音总时长;
将异常静音总时长的占比作为所述完整性特征。
5.根据权利要求2所述的音频质量综合评测方法,其特征在于,
从所述识别文本中获取所述语义置信度特征的方法为:
根据所述识别文本的单词置信度计算语句置信度;
根据语句置信度计算所述识别文本的语义置信度特征。
6.根据权利要求5所述的音频质量综合评测方法,其特征在于,
从所述识别文本中获取所述语义置信度特征的方法具体为:
以所述识别文本中的语句为单位,计算语句内各单词的单词置信度;
将一个语句内的单词置信度的均值作为该语句的语句置信度;
计算语句置信度的均值,得到所述识别文本的语义置信度特征。
7.根据权利要求1~6任一项所述的音频质量综合评测方法,其特征在于,所述音频质量评测模型的训练方式包括:对所述音频质量评测模型的音频训练样本的音频质量,按预设的主观分级标准进行评测。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于安徽听见科技有限公司,未经安徽听见科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811368468.0/1.html,转载请声明来源钻瓜专利网。