[发明专利]一种支持不同语种的命令词检测方法及设备在审

专利信息
申请号: 201910932340.0 申请日: 2019-09-29
公开(公告)号: CN110580908A 公开(公告)日: 2019-12-17
发明(设计)人: 匡方军;李深;雷欣;李志飞 申请(专利权)人: 出门问问信息科技有限公司
主分类号: G10L17/02 分类号: G10L17/02;G10L17/18;G10L17/24
代理公司: 11734 北京乐知新创知识产权代理事务所(普通合伙) 代理人: 江宇
地址: 100044 北京市海淀区*** 国省代码: 北京;11
权利要求书: 查看更多 说明书: 查看更多
摘要: 发明公开了一种支持不同语种的命令词检测方法及设备,首先采集至少包括两种不同语种的语音信号;接着提取所述语音信号的音频特征;进一步地通过深度学习网络对所提取的音频特征进行分类预测,得到分类预测结果;若所述分类预测结果为命令词的概率最大,则将所述概率最大的命令词作为输出结果。
搜索关键词: 音频特征 预测结果 分类 语种 输出结果 语音信号 概率 采集 检测 预测 网络 学习
【主权项】:
1.一种支持不同语种的命令词检测方法,其特征在于,所述方法包括:/n采集至少包括两种不同语种的语音信号;/n提取所述语音信号的音频特征;/n通过深度学习网络对所提取的音频特征进行分类预测,得到分类预测结果;/n若所述分类预测结果为命令词的概率最大,则将所述概率最大的命令词作为输出结果。/n
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于出门问问信息科技有限公司,未经出门问问信息科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/patent/201910932340.0/,转载请声明来源钻瓜专利网。

同类专利
  • 语音变音检测方法、系统、移动终端及存储介质-201910888401.8
  • 陈文敏;肖龙源;李稀敏;蔡振华;刘晓葳;王静 - 厦门快商通科技股份有限公司
  • 2019-09-19 - 2020-02-14 - G10L17/02
  • 本发明适用于自动说话人验证技术领域,提供了一种语音变音检测方法、系统、移动终端及存储介质,该方法包括:获取样本语音数据,并对样本语音数据进行特征提取,以得到cqt语音特征;对cqt语音特征进行优化处理,以得到cqcc语音特征,并将cqcc语音特征输入至预设卷积神经网络进行模型训练,以得到语音检测模型;获取待检测语音,将待检测语音输入至语音检测模型进行语音分析,并根据语音检测模型的分析结果对待检测语音进行变音判定。本发明无需进行人工特征选择,通过采用基于卷积神经网络的方式以进行模型训练,提高了后续针对待检测语音的变音检测的准确性,通过基于cqt特征的提取和优化,提高了语音检测模型的分辨率。
  • 控制接入的方法和装置-201510761925.2
  • 吴向阳;和江涛;苏锋;赵植 - 华为技术有限公司
  • 2015-11-10 - 2020-02-14 - G10L17/02
  • 本发明公开了一种控制接入的方法和装置,该方法包括:系统中的接入控制设备接收语音输入设备发送的处理语音,该处理语音是该语音输入设备采用第一处理信号对用户的输入语音进行处理生成的,该输入语音用于对该用户接入系统进行安全认证;该接入控制设备采用第二处理信号对该系统中预存储的该用户的原始语音进行处理生成参考语音,该原始语音是该接入控制设备中预存储的用于对该用户接入该系统进行安全认证的对比语音,该第一处理信号与该第二处理信号相同;该接入控制设备根据该处理语音与该参考语音的语音特征的匹配度,确定是否允许该用户接入该系统。因此,本发明实施例的控制接入的方法和装置,能够避免用户恶意接入系统。
  • 音频数据确定方法、装置、设备和介质-201911076290.7
  • 郑榕;王黎明 - 北京远鉴信息技术有限公司
  • 2019-11-06 - 2020-02-11 - G10L17/02
  • 本发明实施例公开了一种音频数据确定方法、装置、设备和介质。所述方法包括:从目标用户的音频数据集中选择属于语音类音频的音频数据,作为候选音频数据;根据所述候选音频数据的音频参数和身份向量,对所述候选音频数据进行筛选,以得到目标用户的目标音频数据,供添加到声纹库中。本发明实施例通过将目标用户的音频数据集中的语音类音频的音频数据,作为候选音频数据,并依据候选音频数据的音频参数和身份向量,确定目标用户的目标音频数据,供添加到声纹库中,本方法无需人工对音频数据进行审核,音频数据入库速度快,提高了声纹库的建库效率。
  • 一种动态声纹密码系统的实现方法-201610892298.0
  • 蒲瑶;李全忠;何国涛;赵成辉;赵茂祥;张玉;吴延辉;刘郁松 - 普强信息技术(北京)有限公司
  • 2016-10-13 - 2020-02-11 - G10L17/02
  • 本发明涉及一种动态声纹密码系统的实现方法,包括以下步骤:在声纹密码系统增加固定数字串或字符串集合,系统随机从这些固定数字串组合或固定字符串组合中挑选一个组合作为密码;用户按照提示读取该密码,声纹系统产生用户声纹信息;验证过程中,声纹系统从有限密码中随机选取组合,用户按照提示读;声纹系统比较声纹特征,识别用户所读的组合;声纹系统输出置信度。本发明有益效果为:大大减少密码个数,声纹系统更容易训练出不同人之间的区分度,由于识别内容变少,识别率得到提高;既解决文本相关系统中密码容易造假的问题,又减少声纹的空间。
  • 基于语音的个人信用评估方法、装置、终端及存储介质-201910858753.9
  • 向纯玉 - 深圳壹账通智能科技有限公司
  • 2019-09-11 - 2020-01-31 - G10L17/02
  • 本发明提供了一种基于语音的个人信用评估方法,包括:获取用户的语音;提取所述语音中的声纹特征矢量;根据所述声纹特征矢量识别所述用户的方言;根据所述语音识别所述用户的性别及年龄;根据所述用户的方言、性别及年龄生成用户个人信息报告;比对所述用户个人信息报告与用户的个人资料后输出用户信用评估结果。本发明还提供了一种基于语音的个人信用评估装置、终端及存储介质。本发明对用户的语音进行多个维度的信息提取与分析,提取的多个维度的信息能够真实且全面的反映用户的性别、年龄及地区,最后与个人资料进行比对时,评估出的个人信用准确率更高,更全面和客观。
  • 一种基于语音交互的数据库运维方法及装置-201910849026.6
  • 李超德;杨小华;黄凤仙;朱浩 - 北京新数科技有限公司
  • 2019-09-09 - 2020-01-24 - G10L17/02
  • 本发明公开了一种基于语音交互的数据库运维方法及装置,包括:获取数据库管理员输入的语音信号;利用预设声纹存储库,对所述语音信号进行声纹鉴权;若判断获知所述语音信号声纹鉴权通过,则对所述语音信号进行识别得到识别结果;根据所述识别结果在预设语音交互指令库中检索对应的指令;利用所述指令通过各种接口对数据库进行运维管理。相较于现有技术具有以下优点:(1)降低学习门槛,简化数据库运维的难度;(2)减少了查询指令,登录服务,执行操作等一系列繁琐动作,提高运维效率;(3)减少运维失误率,保证数据资产安全;(4)系统集成声纹验证系统,保证有权限人员才能进行操作,保证系统安全的情况下,也简化了身份验证过程。
  • 录音回放攻击的检测方法及对应检测模型的训练方法-201911114420.1
  • 葛亮 - 国微集团(深圳)有限公司
  • 2019-11-14 - 2020-01-21 - G10L17/02
  • 本发明公开了一种录音回放攻击的检测方法及对应检测模型的训练方法。其中录音回放攻击检测模型的训练方法,包括:获取语音数据并预处理,所述语音数据包括回放语音数据和真实语音数据;将每一条语音数据进行分帧处理,然后将每一条语音数据的各帧数据进行加窗、快速傅里叶变换处理;将每一条语音数据进行快速傅里叶变换处理后的各帧数据采用倒梅尔、子带频率质心、子带幅值质心滤波器当中的任意一种或多种进行特征提取得到对应的特征矩阵,将每一种语音数据的所有特征矩阵分别通过EM算法对GMM进行迭代运算直至收敛,得到每一种回放语音数据和每一种真实语音数据的至少一个模型分类器。本发明可以更加准确验证待测音频具体是什么类型的音频。
  • 一种人脸图像生成方法及电子设备-201911033642.0
  • 黄俊仁 - 维沃移动通信有限公司
  • 2019-10-28 - 2020-01-17 - G10L17/02
  • 本发明公开了一种人脸图像生成方法及电子设备,该方法包括:获取目标音频;提取所述目标音频的声纹特征数据;将所述目标音频的声纹特征数据输入至预先生成的目标模型,输出目标人脸图像。实施上述方法,可以基于通话方的语音信息,通过更直观地方式,显示通话方的形象,能够满足通话一方对通话另一方声音的想象,丰富电子设备的语音通话功能。
  • 声纹识别的训练方法、装置、终端及计算机存储介质-201911099099.4
  • 陈昊亮;许敏强;杨世清 - 广州国音智能科技有限公司
  • 2019-11-11 - 2020-01-07 - G10L17/02
  • 本发明公开了一种声纹识别的训练方法、装置、终端及计算机存储介质。所述声纹识别的训练方法包括:获取标识的声纹信息的声纹特征向量,将所述声纹特征向量作为声纹识别的神经网络的输入值,获取所述声纹识别的神经网络的输出值,基于所述输出值与所述标识的声纹信息的标识信息,调整所述声纹识别的神经网络的层结构,以获得更加精准的声纹识别的神经网络,进而提高声纹识别的神经网络的识别准确率。
  • 一种可植入式离线声纹识别系统-201910766034.4
  • 任超;钟亚希;陈志骏 - 效生软件科技(上海)有限公司
  • 2019-08-19 - 2019-11-29 - G10L17/02
  • 本发明公开了一种可植入式离线声纹识别系统,包括:语音的前端预处理模块:通过对语音的预处理,降低接收语音中干扰识别结果的因素,提高声纹识别质量;声纹注册模块:提供给用户进行注册时候使用,通过对经过前端预处理模块预处理过的用户注册语音进行特征提取,并采用自定义加密方式保存用户声纹特征,从而建立用户声纹模型;声纹验证模块:用户使用声纹验证时,根据经过前端预处理模块预处理过的录入的用户语音而提取的特征值,跟模型库中的声纹模型特质进行比对,得到识别结果,本发明能够轻松植入到现行通用系统,并且在离线状态下快速、准确、有效的声纹注册、识别功能。从而拓宽声纹识别的应用场景,让声纹识别技术得到更广阔的应用。
  • 用于交互式语音应答的提示音智能打断装置-201910770867.8
  • 卢恒娜;赖勇铨;张靖友 - 中信银行股份有限公司
  • 2019-08-20 - 2019-11-29 - G10L17/02
  • 本发明公开了一种用于交互式语音应答的提示音智能打断装置,包括:声纹信息储存模块,其用来预先存储用户的声纹信息;声纹特征模型,其用来接收用户的语音流并实时提取出声纹特征;以及声纹特征匹配模块,其用来计算声纹特征模型提取出声纹特征与声纹信息储存模块中预先存储的用户的声纹信息的相似度,当该相似度小于阈值时提示音打断,否则提示音继续。该装置可以实现提示音精准快速打断。
  • 一种基于说话人身份的音频数据清洗方法、装置和设备-201910809574.6
  • 许敏强;杨世清;刘敏;蒋敬;王泽龙;张露露 - 广州国音智能科技有限公司
  • 2019-08-29 - 2019-11-22 - G10L17/02
  • 本申请实施例公开了一种基于说话人身份的音频数据清洗方法、装置和设备,包括:对获取的原始音频数据进行解码;分离出所述解码后音频数据中的有效音频,所述有效音频为包含人声的片段;分段处理所述有效音频,得到若干分段的音频,所述若干分段的音频中每段音频对应单个人;对所述若干分段的音频进行话者分离,分离出属于同一个人的第一音频数据;将从多段原始音频中对应的所述第一音频数据进行声纹聚类,得到第二音频数据,将第二音频数据进行标注。本申请通过对音频数据进行分段处理,得到的每段音频片段都对应单个人,再将音频片段进行聚类,将属于同一个人的片段进行聚合,使得精细化的分离出音频中不同人的语音信息。
  • 一种说话人确认方法及装置-201710214666.0
  • 李蓝天;王东 - 清华大学
  • 2017-04-01 - 2019-11-22 - G10L17/02
  • 本发明提供一种说话人确认方法及装置,包括:获取第二语音;将预先获取的第一语音和所述第二语音转换成对应的第一声谱图和第二声谱图;使用卷积神经网络对所述第一声谱图和所述第二声谱图进行特征提取,获取对应的第一特征和第二特征;使用时延神经网络对所述第一特征和所述第二特征进行特征提取,获取对应的第三特征和第四特征;根据所述第三特征和所述第四特征对说话人进行确认。本发明通过将卷积神经网络和时延神经网络相结合,对所述第一语音和所述第二语音进行两次特征提取,将最终提取的第三特征和第四特征进行比较,从而实现对说话人的确认,本发明计算简单,鲁棒性强,能达到很好的识别效果。
  • 声纹密码认证方法及系统-201510121720.8
  • 殷兵;方昕;魏思;胡国平;王影;胡郁;刘庆峰 - 科大讯飞股份有限公司
  • 2015-03-19 - 2019-11-15 - G10L17/02
  • 本发明公开了一种声纹密码认证方法及系统,该方法包括:接收登录用户的语音数据,并将所述语音数据作为测试语音数据;提取所述测试语音数据的特征,得到测试语音特征;利用所述测试语音特征及注册说话人模型估计测试语音相对于注册语音的特征域偏差,得到第一特征域偏差;根据所述第一特征域偏差对所述测试语音特征进行修正,得到第一修正测试语音特征;利用所述第一修正测试语音特征进行声纹认证。本发明可以提升声纹认证的准确度。
专利分类
×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

400-8765-105周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top