[发明专利]一种实时语音样本检测方法及系统有效
申请号: | 201410374728.0 | 申请日: | 2014-07-31 |
公开(公告)号: | CN104217715B | 公开(公告)日: | 2017-06-16 |
发明(设计)人: | 宋战江;孟康健;郭永刚;汪浩;王霞 | 申请(专利权)人: | 北京诺亚星云科技有限责任公司 |
主分类号: | G10L15/00 | 分类号: | G10L15/00;G10L17/00;G10L17/02 |
代理公司: | 北京三聚阳光知识产权代理有限公司11250 | 代理人: | 寇海侠 |
地址: | 100041 北京市石景山*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 实时 语音 样本 检测 方法 系统 | ||
技术领域
本发明涉及一种样本检测方法及系统,具体地说是一种实时语音样本检测方法及系统。
背景技术
伴随着信息技术和网络技术的迅猛发展,人们对身份识别技术的需求越来越多,对其安全可靠性的要求也越来越严格。基于传统密码认证的身份识别技术在实际信息网络应用中已经暴露出许多不足之处,而基于生物特征辨别的身份识别技术近年来也日益成熟并在实际应用中展现出极大的优越性。其中,声纹识别技术被认为是一种新的更有效的身份识别技术之一。
声纹是指说话人语音频谱的信息图。由于每个人的发音器官不同,所发出来的声音及其音调各不相同,因此,声纹作为基本特征来实现人的身份识别具有实际的不可替代性和稳定性。声纹识别可以分为文本有关的说话人识别和文本无关的说话人识别两种:前者要求用户根据规定的内容发音,并根据发音的内容建立模型进行匹配,虽然这样可以使得匹配效果较好,但需要用户完全配合,灵活性和容错性欠佳;后者由于不限定用户的发音,所以要建立精确模型的难度较高,识别效果可能不如前者,但相比前者具有更好的适应性和实用性。
中国专利文献CN101923855A公开了一种文本无关的声纹识别方法及系统,首先使用语音采集设备采集用户客人语音信号作为系统的输入,并为该客人的声音特征建立一种较精确的声学模型,模型将被存储在语音特征库中;当待识别人进行声纹识别时,系统将使用采集到的语音信号作为输入,在语音特征库中进行声学模型的匹配计算,最终将与之最为匹配的模型编号返回,以此来确定说话人的具体身份。该专利虽然能够进行文本无关的声纹识别,但是该专利文献不能够对语音信号进行实时地声纹识别,为了实时的进行声纹识别,就需要实时地获取语音样本。
发明内容
为此,本发明所要解决的技术问题在于克服现有技术中不能实时地获取语音样本的问题,提供一种实时语音样本检测方法。
为解决上述技术问题,本发明是一种实时语音样本检测方法,包括如下步骤:
获取当前语音片段;
识别当前语音片段中的有效音;
根据所述有效音对当前语音片段进行划分得到候选语音段;
当出现至少一个另外的有效音时,重新获取当前语音片段,并识别其中有效音,根据所述有效音对当前语音片段进行划分得到候选语音段;
依次循环上述重新获取当前语音片段的过程,获得所有候选语音段作为实时语音样本。
一种实时语音样本检测方法,识别当前语音片段中的有效音的过程,包括:
计算所述语音片段中每帧的能量,
当能量大于能量阈值时作为有效音,否则作为静音。
一种实时语音样本检测方法,根据所述有效音对当前语音片段进行划分得到候选语音段的过程,包括:
建立一个滑动窗;
以所述语音片段的最后一个有效音为起点,向前获取具有该滑动窗长度的语音段作为一个候选语音段;
以所述最后一个有效音的前一个有效音为起点,向前获取具有该滑动窗长度的语音段作为另一个候选语音段;
按照上述顺序依次获取候选语音段直到所述候选语音段包含第一个有效音。
一种实时语音样本检测方法,根据所述有效音对当前语音片段进行划分得到候选语音段的过程,包括:
建立一个滑动窗;
以所述语音片段的最后一个有效音为起点,向前获取具有该滑动窗长度的语音段作为一个候选语音段;
以所述最后一个有效音的前第n个有效音为起点,向前获取具有该滑动窗长度的语音段作为另一个候选语音段,其中n为大于或者等于1的整数;
按照上述顺序依次获取候选语音段直到所述候选语音段包含第一个有效音。
一种实时语音样本检测方法,所述滑动窗的长度为一个或多个有效音的长度。
一种实时语音样本检测方法,当出现至少一个另外的有效音时,重新获取当前语音片段,并识别其中有效音,根据所述有效音对当前语音片段进行划分得到候选语音段的过程包括:
当出现一个另外的有效音时,识别该有效音,并以该有效音为起点,向前获取具有所述滑动窗长度的语音段作为新的候选语音段。
一种实时语音样本检测方法,当出现至少一个另外的有效音时,重新获取当前语音片段,并识别其中有效音,根据所述有效音对当前语音片段进行划分得到候选语音段的过程包括:
当出现一个另外的有效音时,识别该有效音,并以该有效音为起点,向前获取具有所述滑动窗长度的语音段作为新的候选语音段;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京诺亚星云科技有限责任公司,未经北京诺亚星云科技有限责任公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201410374728.0/2.html,转载请声明来源钻瓜专利网。