[发明专利]说话人确认方法和说话人确认设备有效
申请号: | 201710179026.0 | 申请日: | 2017-03-23 |
公开(公告)号: | CN108630207B | 公开(公告)日: | 2021-08-31 |
发明(设计)人: | 刘柳;刘汝杰;石自强 | 申请(专利权)人: | 富士通株式会社 |
主分类号: | G10L17/02 | 分类号: | G10L17/02;G10L17/04;G10L15/26;G10L25/51;G10L25/18;G10L25/24 |
代理公司: | 北京集佳知识产权代理有限公司 11227 | 代理人: | 康建峰;吴琼 |
地址: | 日本神*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 说话 确认 方法 设备 | ||
本发明公开了一种说话人确认方法和说话人确认设备。该说话人确认方法用于验证是否由特定说话人进行特定发言,该方法包括:从输入语音中提取与任何文本内容无关的说话人特征,并将所提取的说话人特征与所存储的特定说话人特征进行比较,以确定是否是特定说话人在说话;基于输入语音帧序列的频域特征,从输入语音帧序列中提取分别与彼此不同文本内容对应的多个模板构成的模板串;以及将所得到的模板串与所存储的特定说话人的特定内容模板串进行比较,以确定是否进行了特定发言。
技术领域
本发明一般地涉及信息处理技术领域。具体而言,本发明涉及一种能够准确地验证是否由特定说话人进行特定发言的方法和设备。
背景技术
说话人确认技术的目的是验证说话人的身份,判断是否是之前注册的那位特定说话人。说话人确认主要依赖于说话人的语音特征,如语音生物测定。作为一个相关技术,说话人识别技术需要长时间的(如10秒到30秒)的音频来识别说话人是否是多个特定说话人之一。如果音频长度过短,例如少于10秒,则说话人识别的准确性将会显著降低,例如从不到5%的错误率升至约15%的错误率。因此,说话人识别技术需要输入音频的长度超过10秒。但是,对于说话人确认技术而言,为了验证说话人的身份而与说话人识别技术类似地要求说话人说话超过10秒显然是不合适的。
解决办法之一是引入特定的发言,形成文本依赖的说话人确认技术。这样,即使音频长度较短,说话人验证的准确性依然较高。另外,特定发言在某种程度上可以起到类似于密码的作用。
因此,文本依赖的说话人确认技术需要确定是否由特定说话人进行特定的发言。传统的技术,如动态时间规整(dynamic time warping,DTW)、连续隐马尔可夫模型(continuous density hidden Markov model,CDHMM)都存在不足,比如难以处理文本内容的时间序列信息等。这是因为传统的技术都将验证是否是特定说话人和验证是否是特定发言两者作为一个任务完成,将所有的信息混合在一起进行使用。具体地,传统的技术从输入帧中提取一个既包括说话人特征又包括文本信息的特征,用这一个特征验证说话人和发言两者,不能将两者分开。
因此,本发明旨在提出一种准确地进行文本依赖的说话人确认的方法和设备。
发明内容
在下文中给出了关于本发明的简要概述,以便提供关于本发明的某些方面的基本理解。应当理解,这个概述并不是关于本发明的穷举性概述。它并不是意图确定本发明的关键或重要部分,也不是意图限定本发明的范围。其目的仅仅是以简化的形式给出某些概念,以此作为稍后论述的更详细描述的前序。
为了实现上述目的,根据本发明的一个方面,提供了一种验证是否由特定说话人进行特定发言的方法,该方法包括:从输入语音中提取与任何文本内容无关的说话人特征,并将所提取的说话人特征与所存储的特定说话人特征进行比较,以确定是否是特定说话人在说话;基于输入语音帧序列的频域特征,从输入语音帧序列中提取分别与彼此不同文本内容对应的多个模板构成的模板串;以及将所得到的模板串与所存储的特定说话人的特定内容模板串进行比较,以确定是否进行了特定发言。
根据本发明的另一个方面,提供了一种验证是否由特定说话人进行特定发言的设备,该设备包括:特定说话人判断装置,被配置为:从输入语音中提取与任何文本内容无关的说话人特征,并将所提取的说话人特征与所存储的特定说话人特征进行比较,以确定是否是特定说话人在说话;模板串提取装置,被配置为:基于输入语音帧序列的频域特征,从输入语音帧序列中提取分别与彼此不同文本内容对应的多个模板构成的模板串;以及特定发言判断装置,被配置为:将所得到的模板串与所存储的特定说话人的特定内容模板串进行比较,以确定是否进行了特定发言。
另外,根据本发明的另一方面,还提供了一种存储介质。所述存储介质包括机器可读的程序代码,当在信息处理设备上执行所述程序代码时,所述程序代码使得所述信息处理设备执行根据本发明的上述方法。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于富士通株式会社,未经富士通株式会社许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710179026.0/2.html,转载请声明来源钻瓜专利网。