[发明专利]一种可供比对音素选取方法和装置在审
申请号: | 201980003327.5 | 申请日: | 2019-12-24 |
公开(公告)号: | CN111133508A | 公开(公告)日: | 2020-05-08 |
发明(设计)人: | 卢剑锋 | 申请(专利权)人: | 广州国音智能科技有限公司 |
主分类号: | G10L17/02 | 分类号: | G10L17/02;G10L15/02 |
代理公司: | 深圳市深佳知识产权代理事务所(普通合伙) 44285 | 代理人: | 王兆林 |
地址: | 510000 广东省广州市黄埔*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 音素 选取 方法 装置 | ||
本申请公开了一种可供比对音素选取方法和装置,其中方法包括:获取样本语音的语谱图;在样本语音的语谱图中标注出5个以上的第一目标音素;计算样本语音中的每个第一目标音素与检材语音的语谱图中标注的每个第一目标音素的共振峰频率偏差,生成偏差值矩阵;当偏差值矩阵中的偏差值小于预置偏差阈值时,将小于预置偏差阈值的偏差值对应的一对第一目标音素作为可供比对音素,解决了现有技术中通过1:1测量选取可供比对音素方法存在速度慢和效率低的技术问题。
技术领域
本发明涉及声纹鉴定技术领域,尤其涉及一种可供比对音素选取方法和装置。
背景技术
声纹鉴定又称语音同一性鉴定,同一性鉴定是指通过未知说话人或不确定说话人的语音声学特征与已知说话人的语音声学特征进行综合分析比对,做出两者是否同一的结论的过程。在侦查初期,未知说话人或不确定说话人一般是身份不明或者身份不能确定的,已知说话人通常指的是被怀疑者或被指认者,利用二者的声学特征作比对来确定是否同一。
音素是语音中的最小单位,依据音节里的发音动作来分析,一个动作构成一个音素。同一性鉴定中一般是通过对检材和样本中的相同的音素作比对。现有技术中最相近似的可供比对音素是通过1:1测量比对选取得到的,该方法通过在检材和样本中分别各标注出一对相同音素,进而判断这两个音素是否属于可供比对音素,由于相同音素在不同词句中存在着非零偏差,尤其是在录音设备不同或者情绪不同的情况下,在检材和样本进行1:1测量比对时,往往难以一次性准确的标注出可供比对的一对音素,往往需要多次人工1:1测量比对,存在速度慢和效率低的问题。
发明内容
本申请提供了一种可供比对音素选取方法和装置,用于解决现有技术中通过1:1测量选取可供比对音素方法存在速度慢和效率低的技术问题。
有鉴于此,本申请第一方面提供了一种可供比对音素选取方法,包括:
获取样本语音的语谱图;
在所述样本语音的语谱图中标注出5个以上的第一目标音素;
计算所述样本语音中的每个所述第一目标音素与检材语音的语谱图中标注的每个所述第一目标音素的共振峰频率偏差,生成偏差值矩阵;
当所述偏差值矩阵中的偏差值小于预置偏差阈值时,将小于所述预置偏差阈值的所述偏差值对应的一对所述第一目标音素作为可供比对音素。
优选地,所述计算所述样本语音中的每个所述第一目标音素与检材语音的语谱图中标注的每个所述第一目标音素的共振峰频率偏差,生成偏差值矩阵,之后还包括:
当所述偏差值矩阵中不存在小于所述预置偏差阈值的偏差值时,在所述样本语音的语谱图中标注出第二目标音素,将所述第二目标音素作为新的第一目标音素,返回所述计算所述样本语音中的每个所述第一目标音素与检材语音的语谱图中标注的每个所述第一目标音素的共振峰频率偏差,生成偏差值矩阵的步骤。
优选地,所述当所述偏差值矩阵中的偏差值小于预置偏差阈值时,将小于所述预置偏差阈值的所述偏差值对应的一对所述第一目标音素作为可供比对音素,之后还包括:
根据所述可供比对音素进行同一性鉴定。
优选地,所述计算所述样本语音中的每个所述第一目标音素与检材语音的语谱图中标注的每个所述第一目标音素的共振峰频率偏差,生成偏差值矩阵,之前还包括:
获取所述检材语音的语谱图;
在所述检材语音的语谱图中标注出5个以上的所述第一目标音素。
优选地,所述获取样本语音的语谱图之后,所述在所述样本语音的语谱图中标注出5个以上的第一目标音素之前,还包括:
调整所述样本语音的语谱图的带宽动态范围。
本申请第二方面提供了一种可供比对音素选取装置,包括:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于广州国音智能科技有限公司,未经广州国音智能科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201980003327.5/2.html,转载请声明来源钻瓜专利网。