[发明专利]一种声纹识别性能提升方法、装置、终端及存储介质在审

申请号：	201710741564.4	申请日：	2017-08-25
公开（公告）号：	CN107331400A	公开（公告）日：	2017-11-07
发明（设计）人：	高聪	申请（专利权）人：	百度在线网络技术（北京）有限公司
主分类号：	G10L17/14	分类号：	G10L17/14;G10L17/22;G10L15/22;G10L15/18
代理公司：	北京品源专利代理有限公司11332	代理人：	孟金喆
地址：	100085 北京市***	国省代码：	北京;11
权利要求书：	查看更多	说明书：	查看更多
摘要：	本发明公开了一种声纹识别性能提升方法、装置、终端及存储介质，其中，该方法包括获取用户输入的语音开启指令；确定所述语音开启指令与预设的引导文本是否匹配；若匹配，则提取所述语音开启指令对应的声纹特征；将提取的所述声纹特征与预先确定的样本声纹特征进行匹配，若匹配成功，则执行开启操作，其中所述样本声纹特征是从语义为所述引导文本的语音信息中预先提取的。本发明通过获取用户的个性化语音，依据用户的个性化语音信息提取得到用户的样本声纹特征，根据用户的语音开启指令与样本声纹特征的匹配结果执行后续的开启操作。从而不再受语音样本量的限制，提升了容错机制，提高了声纹识别的准确率和用户体验。
搜索关键词：	一种声纹识别性能提升方法装置终端存储介质
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【主权项】：

一种声纹识别性能提升方法，其特征在于，包括：获取用户输入的语音开启指令；确定所述语音开启指令与预设的引导文本是否匹配；若匹配，则提取所述语音开启指令对应的声纹特征；将提取的所述声纹特征与预先确定的样本声纹特征进行匹配，若匹配成功，则执行开启操作，其中所述样本声纹特征是从语义为所述引导文本的语音信息中预先提取的。

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于百度在线网络技术（北京）有限公司，未经百度在线网络技术（北京）有限公司许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/patent/201710741564.4/，转载请声明来源钻瓜专利网。

上一篇：一种学习效果检测方法、系统及终端设备
下一篇：广播终端及广播内容的播放方法

同类专利

一种语音控制方法和智能家电-201910006805.X
发明人：陈东亮;唐食明;陈立;郭海峰;荣霞芳 -专利权人：四川虹美智能科技有限公司
申请日： 2019-01-04 - 公布日： 2019-06-07 - 主分类号： G10L17/14
摘要：本发明提供了一种语音控制方法和智能家电，应用于智能家电的方法，包括：预先设置童锁功能对应的限制年龄，并执行S1：接收当前用户输入的语音控制指令；S2：确定语音控制指令对应的命令词；S3：确定童锁功能是否开启，如果是，执行S4，否则，执行S6；S4：根据语音控制指令，确定所述当前用户的评估年龄；S5：确定所述评估年龄是否不小于所述限制年龄，如果是，执行S6；S6：执行所述命令词对应的操作。本方案能够提高家电使用的安全性。

基于语音识别的参数调节方法、装置及健身设备-201811535210.5
发明人：张杰 -专利权人：深圳壹账通智能科技有限公司
申请日： 2018-12-14 - 公布日： 2019-06-04 - 主分类号： G10L17/14
摘要：本发明实施例提供了基于语音识别的参数调节方法、装置及健身设备，该方法包括：获取健身者的语音信号；使用预设的深度学习语音识别模型识别语音信号，得到语音文本；提取语音文本中的关键词，得到目标关键词，并将目标关键词与预设的语音指令集中的每个语音指令进行关键词匹配，得到目标语音指令，语音指令集中的每个语音指令至少与一个关键词相对应；响应于目标语音指令，检测健身者的实时心率；判断健身者的实时心率是否在预设心率范围之内；如果健身者的实时心率不在预设心率范围之内，根据目标语音指令调节健身设备的参数。本发明实施例提供的技术方案能够解决现有技术中健身设备不能自动调整参数以满足用户的健身需求的问题。

一种基于位置的会议自动记录方法、电子设备及存储介质-201910072946.1
发明人：傅峰峰 -专利权人：广州富港万嘉智能科技有限公司
申请日： 2019-01-25 - 公布日： 2019-05-28 - 主分类号： G10L17/14
摘要：本发明公开了一种基于位置的会议自动记录方法，包括以下步骤：获取步骤：通过声音采集设备获取当前用户的声音信息；定位步骤：采用声源定位技术以定位声音信息所在位置；判断步骤：判断所述声音信息所在位置是否存储在服务器中，如果是，则将声音信息转化为文字信息并记录下来。本发明还提供了一种电子设备和计算机可读存储介质。本发明的基于位置的会议自动记录方法通过区分声音信息所在位置来进一步判断是否对其讲话内容进行记录，其能够更为高效的对会议进行记录，使得后期进行会议内容查阅的时候更为的方便。

一种基于频域信息量分布的回放语音检测方法-201610023352.8
发明人：王让定;陈亚楠;严迪群;金超;陶表犁;张立 -专利权人：宁波大学
申请日： 2016-01-14 - 公布日： 2019-04-23 - 主分类号： G10L17/14
摘要：本发明公开了一种基于频域信息量分布的回放语音检测方法，属于一种通过研究原始语音和回放语音在固定频率范围上信息量的分布，从而提出了可用于检测回放语音的方法，而通过这种检测方法可有效检测语音是否为回放语音，这种回放语音检测方法能够有效检测来自偷录设备的回放语音，并在回放环境改变情况下，也具备较高的检测准确性；同时，本发明也验证了检测回放语音检测算法具有较好的鲁棒性，采用这种基于频域信息量分布的回放语音检测方法还具有操作简单、适用范围广、检测准确率高等优点。

一种无人售货便利店多语音分辨系统-201711329083.9
发明人：金超 -专利权人：金超
申请日： 2017-11-30 - 公布日： 2019-02-22 - 主分类号： G10L17/14
摘要：本发明公开了一种无人售货便利店多语音分辨系统，包括语音采集系统，所述语音采集系统的连接端设有语音对比系统，所述语音对比系统的连接端设有语音处理系统。本发明通过设有多个语音采集模块、语音对比模块和语音存储模块，以便于多个语音采集模块实时采集无人售货便利店内的消费者发出的语音，语音对比模块将采集到的语音与语音存储模块中的语音相比对，当语音存储模块中没有语音信息时，语音对比模块将采集到的语音信息发送至语音存储模块，从而使消费者在第一次发出声音时即锁定声纹并跟踪消费者后续语音的语音进行商品挑选，避免了使用者直接进行操作，设计合理，操作简单，具有较高的实用性。

一种语音识别的方法、装置、设备及计算机存储介质-201811216937.7
发明人：高永裕;陈昊亮 -专利权人：广州势必可赢网络科技有限公司
申请日： 2018-10-18 - 公布日： 2019-01-04 - 主分类号： G10L17/14
摘要：本发明公开了一种语音识别的方法、装置、设备以及计算机可读存储介质，包括：提取预先建立的语料库中真实语音的预选特征向量；根据预设语音合成算法和所述语料库中所述真实语音对应的文本信息，合成伪造语音，提取所述伪造语音的预选特征向量；利用所述真实语音的预选特征向量和所述伪造语音的预选特征向量对真伪语音分类器进行训练；利用完成训练的真伪语音分器对采集到的待检测的语音进行识别，以便判断所述待检测的语音是否为伪造语音。本发明所提供的方法、装置、设备以及计算机可读存储介质，可以准确高效的识别实际场景中的伪造语音，有效地防止伪音攻击。

终端及身份验证方法-201810846279.3
发明人：项吉;李竹新;叶建平 -专利权人：北京小米移动软件有限公司
申请日： 2018-07-27 - 公布日： 2018-11-16 - 主分类号： G10L17/14
摘要：本公开实施例提供了一种终端及身份验证方法，属于终端技术领域。所述终端包括：麦克风、数字信号处理器和应用处理器AP。通过麦克风采集目标用户的语音验证数据，由数字信号处理器对该语音验证数据进行关键字校验，以及由AP对该语音验证数据进行声纹信息校验，提供了一种基于声纹信息对用户进行身份识别的技术方案，由于麦克风是诸如手机、平板电脑之类的终端的标配，且麦克风的收音孔通常设置在终端的侧面，所以麦克风并不会影响到终端的屏占比，因此基于声纹信息对用户进行身份识别，可以克服指纹识别模组降低终端屏占比的问题，给终端的全面屏设计提供了可能。

基于UBM和SVM的说话人身份识别系统-201710302853.4
发明人：申子健;徐波;陈爱月 -专利权人：申子健
申请日： 2017-05-02 - 公布日： 2018-11-13 - 主分类号： G10L17/14
摘要：基于UBM和SVM的说话人身份识别系统。系统包括：语音格式转换，目的是将原始的语音信号转为适合开发环境的格式；均值特征向量提取系统，目的是便于应用于SVM的计算环境；向量机得分计算系统，主要功能是完成测试语音和训练语音的匹配，从而确定说话人的身份。

声纹识别方法、装置、存储介质及音箱-201810349855.3
发明人：周雷;徐颖 -专利权人：上海问之信息科技有限公司
申请日： 2018-04-18 - 公布日： 2018-11-06 - 主分类号： G10L17/14
摘要：本发明公开一种声纹识别方法、装置、存储介质及音箱，该方法包括获取用户的语音信息；检测所述语音信息是否包括唤醒词，若所述语音信息包括唤醒词，则进入唤醒状态，同时获取所述语音信息的声纹特征信息；将所述声纹特征信息与预存声纹模型信息进行匹配，若匹配成功，则接收控制指令并根据所述控制指令进行操作。通过声纹识别技术以及唤醒词技术的结合，提高了识别的安全性。

服务机器人识别唤醒方法及装置-201711107918.6
发明人：刘雪楠;覃立万 -专利权人：北京康力优蓝机器人科技有限公司
申请日： 2017-11-10 - 公布日： 2018-03-13 - 主分类号： G10L17/14
摘要：本发明公开了一种服务机器人识别唤醒方法和装置，涉及机器人领域，能够减少错误识别次数、提高识别通过率。本发明的方法包括语音消息获取步骤；语音消息解析步骤；暗语匹配步骤声纹特征信息匹配步骤二次声纹特征信息匹配步骤提示用户二次输入语音信息，然后解析语音信息得到声纹特征信息，形成暂存声纹特征信息模板，降低匹配阈值，将该暂存声纹信息模板与预设的声纹特征信息进行二次匹配；若匹配成功，则生成唤醒指令以指示机器人由待机转为服务状态。本发明主要用于机器人在家庭/商业服务中，机器人能够快速从待机状态经过识别唤醒，转变为服务状态。

基于声纹特征的会议记录方法、装置及计算机设备-201710743944.1
发明人：杜念冬;谢延 -专利权人：百度在线网络技术（北京）有限公司
申请日： 2017-08-25 - 公布日： 2018-01-09 - 主分类号： G10L17/14
摘要：本发明提出一种基于声纹特征的会议记录方法、装置及计算机设备，其中，该方法包括确定当前获取的语音数据对应的第一声纹特征；判断所述第一声纹特征与已确定的第二声纹特征是否匹配；若不匹配，则确定与所述第一声纹特征对应的第一标识；以所述第一标识对所述语音数据进行标注记录。由此，实现了根据声纹特征自动将语音数据进行区分，并生成会议记录，节省了时间和成本，提高了会议记录的准确性和可靠性，改善了用户体验。

一种声纹识别性能提升方法、装置、终端及存储介质-201710741564.4
发明人：高聪 -专利权人：百度在线网络技术（北京）有限公司
申请日： 2017-08-25 - 公布日： 2017-11-07 - 主分类号： G10L17/14
摘要：本发明公开了一种声纹识别性能提升方法、装置、终端及存储介质，其中，该方法包括获取用户输入的语音开启指令；确定所述语音开启指令与预设的引导文本是否匹配；若匹配，则提取所述语音开启指令对应的声纹特征；将提取的所述声纹特征与预先确定的样本声纹特征进行匹配，若匹配成功，则执行开启操作，其中所述样本声纹特征是从语义为所述引导文本的语音信息中预先提取的。本发明通过获取用户的个性化语音，依据用户的个性化语音信息提取得到用户的样本声纹特征，根据用户的语音开启指令与样本声纹特征的匹配结果执行后续的开启操作。从而不再受语音样本量的限制，提升了容错机制，提高了声纹识别的准确率和用户体验。

声音处理装置以及声音处理方法-201410189831.8
发明人：井手博康 -专利权人：卡西欧计算机株式会社
申请日： 2014-05-07 - 公布日： 2017-10-20 - 主分类号： G10L17/14
摘要：本发明提供一种声音处理装置以及声音处理方法。声音处理装置的特征为，具备获取声音数据中包含的元音区间的特征量的获取单元；按照每个元音通过非监督分类法将所述获取到的特征量中与多个相同元音对应的特征量，分类为多个集群的分类单元；以及对所述多个元音从分类的集群中决定与相同说话人对应的集群组合的决定单元。

一种个人语音系统-201610693012.6
发明人：胡伟 -专利权人：胡伟
申请日： 2016-08-18 - 公布日： 2017-02-01 - 主分类号： G10L17/14
摘要：一种个人语音系统，所述语音系统包括信息平台个人语音软件和大数据库，所述信息平台个人语音软件包括语音数据存储模块、识别检索模块、数据链接更新模块、数据压缩加密模块、抗声波干扰模块、对外控制接口和操作界面，本发明中个人语音数据库是加载在个人信息移动平台上的个人语音数据包，记载着个人的语言、语气、语境，给个人语音软件以特殊的方式来解读语音信息提供数据支持，个人数据库的建立使得软件能够准确识别使用者的声音。

语音处理方法及装置-201610395662.2
发明人：黄宇 -专利权人：北京云知声信息技术有限公司
申请日： 2016-06-06 - 公布日： 2016-11-16 - 主分类号： G10L17/14
摘要：本发明是关于一种语音处理方法及装置，其中，方法包括：接收用户输入的语音信息；对所述语音信息进行声纹识别，以确定所述用户的特征信息；对所述语音信息进行语音和语义识别，以得到文本识别结果；根据所述特征信息和所述文本识别结果，确定与所述语音信息对应的目标内容推荐服务。通过该技术方案，对用户输入的语音信息分别进行声纹识别和语音、语义识别，确定用户的特征信息和识别结果，其中，特征信息可以是用户的性别和年龄等，识别结果是识别出来的语音信息对应的文字内容，进而根据用户特征信息和识别结果确定对应的目标内容推荐服务，从而满足不同用户的不同推荐需求。

一种说话人的身份确认方法和装置-201410844272.X
发明人：李志锋;李娜;乔宇 -专利权人：中国科学院深圳先进技术研究院
申请日： 2014-12-30 - 公布日： 2016-07-27 - 主分类号： G10L17/14
摘要：本发明适用于语音技术领域，提供了一种说话人的身份确认方法和装置，包括：对训练语音提取JFA超向量并从中生成第一子向量；利用PCA算法将第一子向量投影到第一子空间中；对第一子空间进行随机采样得到Q个第二子空间；将投影到Q个第二子空间中的向量分别映射到Q个第三子空间中；利用非参数线性区分分析对Q个第三子空间进行分析建模；利用投影矩阵W2*W3，将每条训练语音和测试语音的JFA超向量分别投影到Q个第三子空间，得到Q个目标说话人参考向量和Q个测试参考向量；将Q个分类器的输出进行融合；将得分最高的融合结果对应的训练语音的说话人确认为测试语音的说话人。本发明很好地改进了说话人身份确认系统的系统性能。

使用基于人工神经网络的亚语音单位区分的说话人验证及识别-201380069560.6
发明人：约翰-保罗·荷索姆;彼得·J·韦尔默朗;乔纳森·肖 -专利权人：感官公司
申请日： 2013-12-05 - 公布日： 2015-09-09 - 主分类号： G10L17/14
摘要：在一个实施例中，计算机系统存储多个说话人的话音数据，其中所述话音数据包含多个特征向量及每一特征向量的相关联亚语音类。所述计算机系统接着基于所述话音数据，建置人工神经网络ANN以对所述多个说话人中的目标说话人的话音进行建模，其中所述ANN经配置以区分由所述目标说话人说出的亚语音类的实例与由所述多个说话人中的其他说话人说出的亚语音类的实例。

一种基于电网频率数据库的音频取证装置-201420169280.4
发明人：吉建梅;王学强 -专利权人：南京工程学院
申请日： 2014-04-10 - 公布日： 2014-08-27 - 主分类号： G10L17/14
摘要：本实用新型公开了一种基于电网频率数据库的音频取证装置，包括依次连接的信号调理模块、DSP模块和ARM核心板，ARM核心板还分别与触摸显示屏、联网模块相连接，所述信号调理模块内还设置依次连接的信号放大模块、低通滤波器和模数转换器，所述ARM核心板内还设置电网频率匹配模块，所述联网模块和电网频率数据库建立通信连接。通过本实用新型公开的新型音频取证装置，能够识别出当前的音频证据的时间和地点，司法机关就可以对证据的有效性作出判断。

基于SVM和HMM混合模型的男女说话声音分类方法-201210541542.0
发明人：王雷 -专利权人：上海八方视界网络科技有限公司
申请日： 2012-12-13 - 公布日： 2014-06-18 - 主分类号： G10L17/14
摘要：本发明公开了基于SVM和HMM混合模型的男女说话声音分类方法，属于语音音频处理领域。该方法使用SVM和HMM混合模型对男女说话声音进行分类，具体步骤如下：输入不同性别说话人语音信号，提取说话人语音信号中的基因频率，获取不同基因频率的MFCC特征，利用机器学习的SVM和HMM算法训练出男女不同基因频率的混合分类模型，最终达到区分说话人性别的目的。利用本方法，用户可以方便地得到某一段语音音频中的说话人性别，帮助用户获取语音音频的性别特征，从而为进一步的语音音频处理提供帮助。

一种语音识别方法及电子设备-201310576866.2
发明人：戴海生;王茜莺 -专利权人：联想（北京）有限公司
申请日： 2013-11-18 - 公布日： 2014-02-19 - 主分类号： G10L17/14
摘要：本申请提供了一种语音识别方法及电子设备；所述方法应用于包括语音输入模块的电子设备，包括：所述语音输入模块接收语音数据；对接收到的所述语音数据进行第一模式语音识别，所述第一模式语音识别包括识别所述语音数据中是否包含第一语音识别信息；当识别出所述语音数据中包含所述第一语音识别信息时，依据所述语音数据进行第二模式语音识别；依据所述第二模式语音识别的结果，执行或者拒绝执行所述第一语音识别信息对应的操作。本申请能够克服现有技术中语音识别时交互效率低下的缺陷。

一种语音会议纪要的分类方法、设备和系统-201210499273.6
发明人：詹五洲 -专利权人：华为技术有限公司
申请日： 2012-11-29 - 公布日： 2013-03-13 - 主分类号： G10L17/14
摘要：本发明实施例提供一种语音会议纪要的分类方法、设备和系统，涉及通信领域，能够将会场中的语音数据按照说话人的方位分别进行声纹识别，提高了声纹识别准确率，进而提高了语音会议纪要分类的可靠性。其方法为：根据会场的音频数据进行声源定位，以获取音频数据所对应的声源的方位，并将声源的方位写入音频数据的附加域信息，再将语音激活标志写入附加域信息，而后将音频数据打包成音频码流，并将音频码流和音频码流的附加域信息发送至录播服务器，以使得录播服务器根据附加域信息对音频数据进行分类，将音频数据所对应的声源的方位对应的参会者身份写入音频码流的附加域信息中。本发明实施例用于对语音会议纪要进行分类。

专利分类

G 物理

G10 乐器；声学
G10L 语音分析或合成；语音识别；音频分析或处理
G10L17-00 讲话者辨认或验证

免登录下载普通用户下载升级VIP会员，免费下载

[发明专利]一种声纹识别性能提升方法、装置、终端及存储介质在审

专利文献下载