[发明专利]一种识别模型更新方法及系统以及智能终端在审

申请号：	201510945742.6	申请日：	2015-12-16
公开（公告）号：	CN106887231A	公开（公告）日：	2017-06-23
发明（设计）人：	祝铭明	申请（专利权）人：	芋头科技（杭州）有限公司
主分类号：	G10L17/04	分类号：	G10L17/04;G10L17/06;H04M1/725
代理公司：	上海申新律师事务所31272	代理人：	党蕾
地址：	310000 浙江省杭州市余杭区***	国省代码：	浙江;33
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	一种识别模型更新方法系统以及智能终端
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【说明书】：

技术领域

本发明涉及语音识别技术领域，尤其涉及一种识别模型更新方法及系统以及智能终端。

背景技术

声纹识别是一种利用人的声音实现的识别技术，由于人在讲话时使用的发声器官存在一定的差异性，任何两个人声音的声纹图谱都有差异，所以声纹可以作为表征个体差异的生物特征，因此可以通过建立识别模型来表征不同的个体，进而利用该识别模型识别不同的个体。目前识别模型的应用存在一个两难的选择，主要体现在训练语料的长度选取上。一般而言，声纹训练的语料越长，建立的特征模型越精确，识别准确率也就越高，但是这种模型建立的方式的实用性不强；相反地，声纹训练语料较短，能保证较好的实用性，但相对而言其训练生成的模型的识别准确率不高。而在实际应用中，例如应用到一些智能设备中进行语音操作的声纹识别时，既要求有较高的识别准确率，又要求训练语料不能太长，从而保证较好的实用性，则以现有技术中的声纹识别模型建立的技术方案难以实现上述目的。

同样地，现有技术中，需要由用户手动多次录入一定时长的训练语料来辅助建立识别模型，因此会给用户较差的体验，不具备较高的实用性；同时，组合起来的训练语料的长度仍然有限，不能生成较精确的特征模型，识别准确率无法进一步提升；语速语调的变化、情绪波动等也都会影响模型建立的精确度。所以，如何在保证较高的实用性前提下，提高识别模型精确度，进而提高识别准确率是急需解决的问题。

发明内容

根据现有技术中存在的上述问题，现提供一种识别模型更新方法及系统以及智能终端的技术方案，具体包括：

一种识别模型更新方法，其中，所述方法包括：

获取包含至少一个说话人的初始语音信号流；

根据预设的说话人分割算法和说话人聚类算法，获取所述初始语音信号流中分别关联于每一个所述说话人的所述语音信号流；

判断所有所述语音信号流中是否存在能够作为识别对象的所述语音信号流，并将能够作为识别对象的所述语音信号流作为识别信号流输出；

将每个所述说话人的所述识别信号流分别与一预先形成的初始识别模型进行匹配，获取匹配成功的所述识别信号流；

将匹配成功的所述识别信号流作为追加的识别信号流的训练样本，并依据所述训练样本对所述初始识别模型进行更新，最终形成多个识别模型，每个所述识别模型对应于一个所述说话人。

优选的，该识别模型更新方法，其中，所述方法在获取包含至少一个说话人的初始语音信号流之前还包括：

根据预设的所述训练样本建立初始识别模型。

优选的，该识别模型更新方法，其中，根据所述说话人分割算法与所述说话人聚类算法，分别获取所述初始语音信号流中的关联于每个所述说话人的所述语音信号流的方法具体包括：

根据所述说话人分割算法，将所述初始语音信号流分割成多个语音分段，每个所述语音分段中仅包含同一个所述说话人的语音信息；