[发明专利]一种声纹识别性能提升方法、装置、终端及存储介质在审

专利信息
申请号: 201710741564.4 申请日: 2017-08-25
公开(公告)号: CN107331400A 公开(公告)日: 2017-11-07
发明(设计)人: 高聪 申请(专利权)人: 百度在线网络技术(北京)有限公司
主分类号: G10L17/14 分类号: G10L17/14;G10L17/22;G10L15/22;G10L15/18
代理公司: 北京品源专利代理有限公司11332 代理人: 孟金喆
地址: 100085 北京市*** 国省代码: 北京;11
权利要求书: 查看更多 说明书: 查看更多
摘要: 发明公开了一种声纹识别性能提升方法、装置、终端及存储介质,其中,该方法包括获取用户输入的语音开启指令;确定所述语音开启指令与预设的引导文本是否匹配;若匹配,则提取所述语音开启指令对应的声纹特征;将提取的所述声纹特征与预先确定的样本声纹特征进行匹配,若匹配成功,则执行开启操作,其中所述样本声纹特征是从语义为所述引导文本的语音信息中预先提取的。本发明通过获取用户的个性化语音,依据用户的个性化语音信息提取得到用户的样本声纹特征,根据用户的语音开启指令与样本声纹特征的匹配结果执行后续的开启操作。从而不再受语音样本量的限制,提升了容错机制,提高了声纹识别的准确率和用户体验。
搜索关键词: 一种 声纹 识别 性能 提升 方法 装置 终端 存储 介质
【主权项】:
一种声纹识别性能提升方法,其特征在于,包括:获取用户输入的语音开启指令;确定所述语音开启指令与预设的引导文本是否匹配;若匹配,则提取所述语音开启指令对应的声纹特征;将提取的所述声纹特征与预先确定的样本声纹特征进行匹配,若匹配成功,则执行开启操作,其中所述样本声纹特征是从语义为所述引导文本的语音信息中预先提取的。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于百度在线网络技术(北京)有限公司,未经百度在线网络技术(北京)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/patent/201710741564.4/,转载请声明来源钻瓜专利网。

同类专利
  • 一种语音控制方法和智能家电-201910006805.X
  • 陈东亮;唐食明;陈立;郭海峰;荣霞芳 - 四川虹美智能科技有限公司
  • 2019-01-04 - 2019-06-07 - G10L17/14
  • 本发明提供了一种语音控制方法和智能家电,应用于智能家电的方法,包括:预先设置童锁功能对应的限制年龄,并执行S1:接收当前用户输入的语音控制指令;S2:确定语音控制指令对应的命令词;S3:确定童锁功能是否开启,如果是,执行S4,否则,执行S6;S4:根据语音控制指令,确定所述当前用户的评估年龄;S5:确定所述评估年龄是否不小于所述限制年龄,如果是,执行S6;S6:执行所述命令词对应的操作。本方案能够提高家电使用的安全性。
  • 基于语音识别的参数调节方法、装置及健身设备-201811535210.5
  • 张杰 - 深圳壹账通智能科技有限公司
  • 2018-12-14 - 2019-06-04 - G10L17/14
  • 本发明实施例提供了基于语音识别的参数调节方法、装置及健身设备,该方法包括:获取健身者的语音信号;使用预设的深度学习语音识别模型识别语音信号,得到语音文本;提取语音文本中的关键词,得到目标关键词,并将目标关键词与预设的语音指令集中的每个语音指令进行关键词匹配,得到目标语音指令,语音指令集中的每个语音指令至少与一个关键词相对应;响应于目标语音指令,检测健身者的实时心率;判断健身者的实时心率是否在预设心率范围之内;如果健身者的实时心率不在预设心率范围之内,根据目标语音指令调节健身设备的参数。本发明实施例提供的技术方案能够解决现有技术中健身设备不能自动调整参数以满足用户的健身需求的问题。
  • 一种基于位置的会议自动记录方法、电子设备及存储介质-201910072946.1
  • 傅峰峰 - 广州富港万嘉智能科技有限公司
  • 2019-01-25 - 2019-05-28 - G10L17/14
  • 本发明公开了一种基于位置的会议自动记录方法,包括以下步骤:获取步骤:通过声音采集设备获取当前用户的声音信息;定位步骤:采用声源定位技术以定位声音信息所在位置;判断步骤:判断所述声音信息所在位置是否存储在服务器中,如果是,则将声音信息转化为文字信息并记录下来。本发明还提供了一种电子设备和计算机可读存储介质。本发明的基于位置的会议自动记录方法通过区分声音信息所在位置来进一步判断是否对其讲话内容进行记录,其能够更为高效的对会议进行记录,使得后期进行会议内容查阅的时候更为的方便。
  • 一种基于频域信息量分布的回放语音检测方法-201610023352.8
  • 王让定;陈亚楠;严迪群;金超;陶表犁;张立 - 宁波大学
  • 2016-01-14 - 2019-04-23 - G10L17/14
  • 本发明公开了一种基于频域信息量分布的回放语音检测方法,属于一种通过研究原始语音和回放语音在固定频率范围上信息量的分布,从而提出了可用于检测回放语音的方法,而通过这种检测方法可有效检测语音是否为回放语音,这种回放语音检测方法能够有效检测来自偷录设备的回放语音,并在回放环境改变情况下,也具备较高的检测准确性;同时,本发明也验证了检测回放语音检测算法具有较好的鲁棒性,采用这种基于频域信息量分布的回放语音检测方法还具有操作简单、适用范围广、检测准确率高等优点。
  • 一种无人售货便利店多语音分辨系统-201711329083.9
  • 金超 - 金超
  • 2017-11-30 - 2019-02-22 - G10L17/14
  • 本发明公开了一种无人售货便利店多语音分辨系统,包括语音采集系统,所述语音采集系统的连接端设有语音对比系统,所述语音对比系统的连接端设有语音处理系统。本发明通过设有多个语音采集模块、语音对比模块和语音存储模块,以便于多个语音采集模块实时采集无人售货便利店内的消费者发出的语音,语音对比模块将采集到的语音与语音存储模块中的语音相比对,当语音存储模块中没有语音信息时,语音对比模块将采集到的语音信息发送至语音存储模块,从而使消费者在第一次发出声音时即锁定声纹并跟踪消费者后续语音的语音进行商品挑选,避免了使用者直接进行操作,设计合理,操作简单,具有较高的实用性。
  • 一种语音识别的方法、装置、设备及计算机存储介质-201811216937.7
  • 高永裕;陈昊亮 - 广州势必可赢网络科技有限公司
  • 2018-10-18 - 2019-01-04 - G10L17/14
  • 本发明公开了一种语音识别的方法、装置、设备以及计算机可读存储介质,包括:提取预先建立的语料库中真实语音的预选特征向量;根据预设语音合成算法和所述语料库中所述真实语音对应的文本信息,合成伪造语音,提取所述伪造语音的预选特征向量;利用所述真实语音的预选特征向量和所述伪造语音的预选特征向量对真伪语音分类器进行训练;利用完成训练的真伪语音分器对采集到的待检测的语音进行识别,以便判断所述待检测的语音是否为伪造语音。本发明所提供的方法、装置、设备以及计算机可读存储介质,可以准确高效的识别实际场景中的伪造语音,有效地防止伪音攻击。
  • 终端及身份验证方法-201810846279.3
  • 项吉;李竹新;叶建平 - 北京小米移动软件有限公司
  • 2018-07-27 - 2018-11-16 - G10L17/14
  • 本公开实施例提供了一种终端及身份验证方法,属于终端技术领域。所述终端包括:麦克风、数字信号处理器和应用处理器AP。通过麦克风采集目标用户的语音验证数据,由数字信号处理器对该语音验证数据进行关键字校验,以及由AP对该语音验证数据进行声纹信息校验,提供了一种基于声纹信息对用户进行身份识别的技术方案,由于麦克风是诸如手机、平板电脑之类的终端的标配,且麦克风的收音孔通常设置在终端的侧面,所以麦克风并不会影响到终端的屏占比,因此基于声纹信息对用户进行身份识别,可以克服指纹识别模组降低终端屏占比的问题,给终端的全面屏设计提供了可能。
  • 基于UBM和SVM的说话人身份识别系统-201710302853.4
  • 申子健;徐波;陈爱月 - 申子健
  • 2017-05-02 - 2018-11-13 - G10L17/14
  • 基于UBM和SVM的说话人身份识别系统。系统包括:语音格式转换,目的是将原始的语音信号转为适合开发环境的格式;均值特征向量提取系统,目的是便于应用于SVM的计算环境;向量机得分计算系统,主要功能是完成测试语音和训练语音的匹配,从而确定说话人的身份。
  • 声纹识别方法、装置、存储介质及音箱-201810349855.3
  • 周雷;徐颖 - 上海问之信息科技有限公司
  • 2018-04-18 - 2018-11-06 - G10L17/14
  • 本发明公开一种声纹识别方法、装置、存储介质及音箱,该方法包括获取用户的语音信息;检测所述语音信息是否包括唤醒词,若所述语音信息包括唤醒词,则进入唤醒状态,同时获取所述语音信息的声纹特征信息;将所述声纹特征信息与预存声纹模型信息进行匹配,若匹配成功,则接收控制指令并根据所述控制指令进行操作。通过声纹识别技术以及唤醒词技术的结合,提高了识别的安全性。
  • 服务机器人识别唤醒方法及装置-201711107918.6
  • 刘雪楠;覃立万 - 北京康力优蓝机器人科技有限公司
  • 2017-11-10 - 2018-03-13 - G10L17/14
  • 本发明公开了一种服务机器人识别唤醒方法和装置,涉及机器人领域,能够减少错误识别次数、提高识别通过率。本发明的方法包括语音消息获取步骤;语音消息解析步骤;暗语匹配步骤声纹特征信息匹配步骤二次声纹特征信息匹配步骤提示用户二次输入语音信息,然后解析语音信息得到声纹特征信息,形成暂存声纹特征信息模板,降低匹配阈值,将该暂存声纹信息模板与预设的声纹特征信息进行二次匹配;若匹配成功,则生成唤醒指令以指示机器人由待机转为服务状态。本发明主要用于机器人在家庭/商业服务中,机器人能够快速从待机状态经过识别唤醒,转变为服务状态。
  • 基于声纹特征的会议记录方法、装置及计算机设备-201710743944.1
  • 杜念冬;谢延 - 百度在线网络技术(北京)有限公司
  • 2017-08-25 - 2018-01-09 - G10L17/14
  • 本发明提出一种基于声纹特征的会议记录方法、装置及计算机设备,其中,该方法包括确定当前获取的语音数据对应的第一声纹特征;判断所述第一声纹特征与已确定的第二声纹特征是否匹配;若不匹配,则确定与所述第一声纹特征对应的第一标识;以所述第一标识对所述语音数据进行标注记录。由此,实现了根据声纹特征自动将语音数据进行区分,并生成会议记录,节省了时间和成本,提高了会议记录的准确性和可靠性,改善了用户体验。
  • 一种声纹识别性能提升方法、装置、终端及存储介质-201710741564.4
  • 高聪 - 百度在线网络技术(北京)有限公司
  • 2017-08-25 - 2017-11-07 - G10L17/14
  • 本发明公开了一种声纹识别性能提升方法、装置、终端及存储介质,其中,该方法包括获取用户输入的语音开启指令;确定所述语音开启指令与预设的引导文本是否匹配;若匹配,则提取所述语音开启指令对应的声纹特征;将提取的所述声纹特征与预先确定的样本声纹特征进行匹配,若匹配成功,则执行开启操作,其中所述样本声纹特征是从语义为所述引导文本的语音信息中预先提取的。本发明通过获取用户的个性化语音,依据用户的个性化语音信息提取得到用户的样本声纹特征,根据用户的语音开启指令与样本声纹特征的匹配结果执行后续的开启操作。从而不再受语音样本量的限制,提升了容错机制,提高了声纹识别的准确率和用户体验。
  • 声音处理装置以及声音处理方法-201410189831.8
  • 井手博康 - 卡西欧计算机株式会社
  • 2014-05-07 - 2017-10-20 - G10L17/14
  • 本发明提供一种声音处理装置以及声音处理方法。声音处理装置的特征为,具备获取声音数据中包含的元音区间的特征量的获取单元;按照每个元音通过非监督分类法将所述获取到的特征量中与多个相同元音对应的特征量,分类为多个集群的分类单元;以及对所述多个元音从分类的集群中决定与相同说话人对应的集群组合的决定单元。
  • 一种个人语音系统-201610693012.6
  • 胡伟 - 胡伟
  • 2016-08-18 - 2017-02-01 - G10L17/14
  • 一种个人语音系统,所述语音系统包括信息平台个人语音软件和大数据库,所述信息平台个人语音软件包括语音数据存储模块、识别检索模块、数据链接更新模块、数据压缩加密模块、抗声波干扰模块、对外控制接口和操作界面,本发明中个人语音数据库是加载在个人信息移动平台上的个人语音数据包,记载着个人的语言、语气、语境,给个人语音软件以特殊的方式来解读语音信息提供数据支持,个人数据库的建立使得软件能够准确识别使用者的声音。
  • 语音处理方法及装置-201610395662.2
  • 黄宇 - 北京云知声信息技术有限公司
  • 2016-06-06 - 2016-11-16 - G10L17/14
  • 本发明是关于一种语音处理方法及装置,其中,方法包括:接收用户输入的语音信息;对所述语音信息进行声纹识别,以确定所述用户的特征信息;对所述语音信息进行语音和语义识别,以得到文本识别结果;根据所述特征信息和所述文本识别结果,确定与所述语音信息对应的目标内容推荐服务。通过该技术方案,对用户输入的语音信息分别进行声纹识别和语音、语义识别,确定用户的特征信息和识别结果,其中,特征信息可以是用户的性别和年龄等,识别结果是识别出来的语音信息对应的文字内容,进而根据用户特征信息和识别结果确定对应的目标内容推荐服务,从而满足不同用户的不同推荐需求。
  • 一种说话人的身份确认方法和装置-201410844272.X
  • 李志锋;李娜;乔宇 - 中国科学院深圳先进技术研究院
  • 2014-12-30 - 2016-07-27 - G10L17/14
  • 本发明适用于语音技术领域,提供了一种说话人的身份确认方法和装置,包括:对训练语音提取JFA超向量并从中生成第一子向量;利用PCA算法将第一子向量投影到第一子空间中;对第一子空间进行随机采样得到Q个第二子空间;将投影到Q个第二子空间中的向量分别映射到Q个第三子空间中;利用非参数线性区分分析对Q个第三子空间进行分析建模;利用投影矩阵W2*W3,将每条训练语音和测试语音的JFA超向量分别投影到Q个第三子空间,得到Q个目标说话人参考向量和Q个测试参考向量;将Q个分类器的输出进行融合;将得分最高的融合结果对应的训练语音的说话人确认为测试语音的说话人。本发明很好地改进了说话人身份确认系统的系统性能。
  • 一种基于电网频率数据库的音频取证装置-201420169280.4
  • 吉建梅;王学强 - 南京工程学院
  • 2014-04-10 - 2014-08-27 - G10L17/14
  • 本实用新型公开了一种基于电网频率数据库的音频取证装置,包括依次连接的信号调理模块、DSP模块和ARM核心板,ARM核心板还分别与触摸显示屏、联网模块相连接,所述信号调理模块内还设置依次连接的信号放大模块、低通滤波器和模数转换器,所述ARM核心板内还设置电网频率匹配模块,所述联网模块和电网频率数据库建立通信连接。通过本实用新型公开的新型音频取证装置,能够识别出当前的音频证据的时间和地点,司法机关就可以对证据的有效性作出判断。
  • 基于SVM和HMM混合模型的男女说话声音分类方法-201210541542.0
  • 王雷 - 上海八方视界网络科技有限公司
  • 2012-12-13 - 2014-06-18 - G10L17/14
  • 本发明公开了基于SVM和HMM混合模型的男女说话声音分类方法,属于语音音频处理领域。该方法使用SVM和HMM混合模型对男女说话声音进行分类,具体步骤如下:输入不同性别说话人语音信号,提取说话人语音信号中的基因频率,获取不同基因频率的MFCC特征,利用机器学习的SVM和HMM算法训练出男女不同基因频率的混合分类模型,最终达到区分说话人性别的目的。利用本方法,用户可以方便地得到某一段语音音频中的说话人性别,帮助用户获取语音音频的性别特征,从而为进一步的语音音频处理提供帮助。
  • 一种语音识别方法及电子设备-201310576866.2
  • 戴海生;王茜莺 - 联想(北京)有限公司
  • 2013-11-18 - 2014-02-19 - G10L17/14
  • 本申请提供了一种语音识别方法及电子设备;所述方法应用于包括语音输入模块的电子设备,包括:所述语音输入模块接收语音数据;对接收到的所述语音数据进行第一模式语音识别,所述第一模式语音识别包括识别所述语音数据中是否包含第一语音识别信息;当识别出所述语音数据中包含所述第一语音识别信息时,依据所述语音数据进行第二模式语音识别;依据所述第二模式语音识别的结果,执行或者拒绝执行所述第一语音识别信息对应的操作。本申请能够克服现有技术中语音识别时交互效率低下的缺陷。
  • 一种语音会议纪要的分类方法、设备和系统-201210499273.6
  • 詹五洲 - 华为技术有限公司
  • 2012-11-29 - 2013-03-13 - G10L17/14
  • 本发明实施例提供一种语音会议纪要的分类方法、设备和系统,涉及通信领域,能够将会场中的语音数据按照说话人的方位分别进行声纹识别,提高了声纹识别准确率,进而提高了语音会议纪要分类的可靠性。其方法为:根据会场的音频数据进行声源定位,以获取音频数据所对应的声源的方位,并将声源的方位写入音频数据的附加域信息,再将语音激活标志写入附加域信息,而后将音频数据打包成音频码流,并将音频码流和音频码流的附加域信息发送至录播服务器,以使得录播服务器根据附加域信息对音频数据进行分类,将音频数据所对应的声源的方位对应的参会者身份写入音频码流的附加域信息中。本发明实施例用于对语音会议纪要进行分类。
专利分类
×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

400-8765-105周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top