[发明专利]一种机顶盒的声纹识别系统及声纹识别方法在审

专利信息
申请号: 201611208792.7 申请日: 2016-12-23
公开(公告)号: CN106847261A 公开(公告)日: 2017-06-13
发明(设计)人: 甘勇;邹伟华 申请(专利权)人: 伟乐视讯科技股份有限公司
主分类号: G10L15/02 分类号: G10L15/02;G10L25/51;H04N21/422
代理公司: 广州三环专利代理有限公司44202 代理人: 章兰芳
地址: 516006 广东省惠*** 国省代码: 广东;44
权利要求书: 查看更多 说明书: 查看更多
摘要: 发明提供一种机顶盒的声纹识别系统及声纹识别方法,其中,系统包括声纹输入单元、特征提取单元、声纹比较单元、数据存储单元、微控制器处理单元;所述特征提取单元用于提取语音信号的特征参数,并输出特征提取后的声纹模拟信号;所述声纹比较单元用于将特征提取后的声纹模拟信号与参照声纹模拟信号进行比较运算后输出数字信号;所述微控制器处理单元用于根据所述数字信号控制所述机顶盒开启或不开启,使得用户仅需向机顶盒的麦克风说出与用户登入账号对应的语音信号即可开启机顶盒,具有操作便捷,用户体验度好的优点,在家庭中使用所述机顶盒时,便于用户对小孩观看电视的时间进行有效管理。
搜索关键词: 一种 机顶盒 声纹 识别 系统 方法
【主权项】:
一种机顶盒的声纹识别系统,其特征在于,包括声纹输入单元、特征提取单元、声纹比较单元、数据存储单元、微控制器处理单元;所述声纹输入单元连接所述特征提取单元,所述特征提取单元连接所述声纹比较单元与所述数据存储单元,所述声纹比较单元连接所述微控制器处理单元;所述声纹输入单元用于接收用户输入的语音信号;所述特征提取单元用于提取所述语音信号的特征参数,并输出特征提取后的声纹模拟信号;所述数据存储单元用于存储参照声纹模拟信号;所述参照声纹模拟信号为用户预先录入的语音信号经特征提取后的声纹模拟信号;所述声纹比较单元用于将特征提取后的声纹模拟信号与参照声纹模拟信号进行比较运算后输出数字信号;所述微控制器处理单元用于根据所述数字信号判断所述特征提取后的声纹模拟信号与参照声纹模拟信号是否匹配成功,若匹配成功,则控制所述机顶盒开启并登入所述参照声纹模拟信号对应的用户登入账号,若匹配不成功,则机顶盒不开启。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于伟乐视讯科技股份有限公司,未经伟乐视讯科技股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/patent/201611208792.7/,转载请声明来源钻瓜专利网。

同类专利
  • 一种基于深度学习的语音识别方法、系统及装置-201910752070.5
  • 许可喜;陆沿青;肖方 - 三星电子(中国)研发中心;三星电子株式会社
  • 2019-08-15 - 2019-11-08 - G10L15/02
  • 本申请公开了一种基于深度学习的语音识别方法,应用于智能家居系统中,包括:所述智能家居系统中的本地服务器获取用户的视频文件和音频文件,从中分析得到所述用户的标识和第一特征信息发送给云服务器;所述云服务器对所述用户的第一特征信息进行深度学习,得到所述用户的第二特征信息,并对所述第二特征信息进行存储;当所述智能家居系统检测到用户发出的语音指令时,从云服务器获取所述用户的第二特征信息;所述智能家居系统中的智能语音引擎根据所述第二特征信息对所述用户的语音指令进行语音识别。本申请还公开了对应的系统和装置。应用本申请公开的技术方案,能够提高智能设备对自然语言理解的准确率。
  • 生成文字记录的方法及系统-201510730972.0
  • 肖悦;王丁;范雄男 - 华勤通讯技术有限公司
  • 2015-10-30 - 2019-11-08 - G10L15/02
  • 本发明涉及语音识别技术领域,公开了一种生成文字记录的方法及系统。本发明中生成文字记录的方法包含以下步骤:第一终端和第二终端相互连接;其中第一终端、第二终端分别预存第一发言者、第二发言者的语音特征信息;第一终端根据第一发言者的语音特征信息识别第一发言者语音信息,并生成第一发言记录;第二终端根据第二发言者的语音特征信息识别第二发言者语音信息,并生成第二发言记录;第一终端将第一发言记录发送给第二终端,第二终端将第二发言记录发送给第一终端;第一终端和第二终端分别按预设的排序规则对所有发言者的发言记录进行排序,并生成发言文字记录。这样使得可以完整记录每一个发言者的发言内容,且可以准确地识别发言者的身份。
  • 一种基于深度神经网络的领域自适应方法-201611201651.2
  • 郭伟 - 云知声(上海)智能科技有限公司
  • 2016-12-23 - 2019-11-08 - G10L15/02
  • 本发明公开了一种基于深度神经网络的领域自适应方法,是基于深度神经网络模型,利用原有的网络参数(大数据训练生成,缺少领域数据),在有少量领域数据的情况下,利用领域数据训练单独的隐层,同时在输出层进行融合,最终生成领域模型;利用同时进行多项任务(Multi‑Task)的思想,结合少量的有监督领域数据(如5H‑10H的领域数据),同时对领域数据进行模拟,采用不同的特征,对神经网络参数进行更新,对新领域测试集合效果提升明显,又不影响旧领域性能。
  • 基于人工智能的语音唤醒方法和装置-201611111477.2
  • 唐立亮 - 百度在线网络技术(北京)有限公司
  • 2016-12-02 - 2019-11-08 - G10L15/02
  • 本发明提出一种基于人工智能的语音唤醒方法和装置,其中,该语音唤醒方法,包括:获取自定义唤醒词对应的发音信息;获取所述发音信息对应的近似发音信息;根据预设的垃圾词列表、所述发音信息和所述近似发音信息构建唤醒词识别网络,以根据所述唤醒词识别网络对用户输入的语音进行识别,并根据识别结果确定是否执行唤醒操作。本发明的实施例,能够针对不同的自定义唤醒动态构建唤醒词识别网络,有效提升唤醒的正确率,并降低误报率,能够提升唤醒效率,内存占用更小,功耗低。
  • 控制智能设备的方法及装置-201910611055.9
  • 张甲年 - 海尔优家智能科技(北京)有限公司
  • 2019-07-08 - 2019-11-05 - G10L15/02
  • 本申请涉及智能家居技术领域,公开了一种控制智能设备的方法,包括:获取语音控制指令的特征音频数据;根据特征音频数据获取特征频率数据;在所述特征频率数据与用于参考的样本频率数据匹配的情况下,响应于所述语音控制指令。本申请能够基于声音的频率数据触发智能设备根据语音控制指令执行相应操作,提高了智能设备的可控性和准确度。本申请还公开了一种控制智能设备的装置、智能设备和计算机可读存储介质。
  • 一种基于深度学习的空中管制语音指令识别方法-201910619285.X
  • 王耀彬 - 上海麦图信息科技有限公司
  • 2019-07-10 - 2019-11-05 - G10L15/02
  • 本发明公开了一种基于深度学习的空中管制语音指令识别方法,包括以下步骤:获取待识别的语音信号,并将其转换为16bit 16kHz的PCM音频数据;建立深度网络模型;利用训练数据训深度网络模型得到语音识别引擎;对所述音频数据进行语音切分;将语音切分得到的有效音频片段输入语音识别引擎,输出文字识别结果。其中,深度网络模型使用卷积模块作为特征提取器,并由reshape层和全连接层对提取的特征数据进行处理,利用门控循环单元进行序列学习,最终通过全连接层进行分类学习与决策,获得预测结果。本发明采用以人工智能深度学习引擎为核心,具有极强的专业适用性和口音泛化能力,数据量依赖程度更低的有点,在空管语音的识别上显著优于通用语音识别系统。
  • 基于唱段和念白提取的戏曲分类方法-201610957057.X
  • 于瑞国;朱思翰;王建荣;于健;徐天一;高洁 - 天津大学
  • 2016-10-27 - 2019-11-05 - G10L15/02
  • 本发明属于机器学习中语音识别分离技术领域,具体涉及一种基于唱段和念白提取的戏曲分类方法。该方法步骤具体为:步骤(1)是对声学时域数据进行特征提取,得到特征向量时间序列数据;步骤(2)是对上述步骤(1)得到的时间序列数据运行节段CDP算法,得出相似段对的候选;步骤(3)是从上述步骤(2)相似段对的候选中进行选择,得出相似段对;步骤(4)是在对上述步骤(3)得出的相似段进行图形化,描述出直方图;步骤(5)是得出唱段边界,并进行唱段和念白提取;步骤(6)是将处理得到的唱段和念白作为传统分类算法的输入,得出最后的结果,并进行准确率和效率的分析。本发明避免人为的去处理大量的数据,导致费时费力且效率很低。
  • 音频管理装置和方法-201610339908.4
  • 王荣洋 - 努比亚技术有限公司
  • 2016-05-19 - 2019-11-05 - G10L15/02
  • 本发明公开了一种音频管理装置,该装置包括:语音识别模块,用于对音频文件进行语音识别,获取所述音频文件对应的文本,以及所述音频文件与所述文本的时间关联信息;信息提取模块,用于根据预先配置的识别模型,提取所述文本的标注信息;标签获取模块,用于根据所述文本的标注信息,以及所述音频文件与所述文本的时间关联信息,获取所述音频文件的标签。本发明还公开了一种音频管理方法。本发明实现了自动识别、智能添加音频文件的标签,无需用户手动对音频文件进行标签的添加和编辑,提升了用户体验。
  • 基于Top-k加强音频词袋模型的语音情感识别方法-201610248979.3
  • 刘文举;梁雅萌 - 中国科学院自动化研究所
  • 2016-04-20 - 2019-10-22 - G10L15/02
  • 本发明公开了一种基于Top‑k加强音频词袋模型的语音情感识别方法,其包括:确定语音情感数据库及其中的训练集和测试集,并提取每一语音样本的帧特征向量;接着,将训练集中所有语音样本的帧特征向量集合起来,通过聚类算法,得到聚类中心,并用聚类中心组成音频词字典;通过计算帧特征向量与码词之间的距离,得到对于训练集和测试集中语音样本的第一句特征向量;然后,对第一句特征向量进行特征选择,得到第二句特征向量;再基于训练集中语音样本的第二句特征向量来训练机器学习识别模型,并使用测试集中语音样本的第二句特征向量作为机器学习识别模型的输入,以得到语音情感识别结果。通过本发明实施例,提高了语音情感识别的识别精度。
  • 声音识别系统以及声音识别装置-201811539331.7
  • 肖灵东;李杭永;肖灵江 - 广州一玛网络科技有限公司
  • 2018-12-14 - 2019-10-18 - G10L15/02
  • 本发明提出了一种声音识别装置及系统,包括降噪抑制模块,对实时获取的用户声音或已存储的其它声音进行噪声抑制,获得降噪后的声音信息;所述噪声抑制模块采用了谱去除法和/或学习同定法和/或降噪自动编码器至少之一进行噪声抑制;转化模块,将所述声音信息进行拉普拉斯变换,得到频谱信息;特征提取模块,获得所述声音信息的梅尔频谱倒数和线性倒谱系数,得到描述所述声音信息的特征向量;模型训练模块,利用训练样本构建声音识别模型,所述声音识别模型的训练利用转化模块获得的频谱信息及特征提取模块提取的特征向量,将由所述梅尔频谱倒数和所述线性倒谱系数得到的所述特征向量输入SVM层;声音识别模块,利用训练好的所述声音识别模块对所述声音信息进行识别。
  • 口考作弊检测方法和装置-201610424906.5
  • 何春江;胡阳;潘颂声 - 科大讯飞股份有限公司
  • 2016-06-13 - 2019-10-18 - G10L15/02
  • 本发明提出一种口考作弊检测方法和装置,该口考作弊检测方法包括:获取当前考生的口考语音数据,以及除所述口考语音数据之外的辅助信息;根据所述口考语音数据和所述辅助信息,提取作弊检测特征,所述作弊检测特征包括:从所述口考语音数据中提取的声纹特征,以及除所述声纹特征之外的其他特征;根据所述作弊检测特征和预先构建的作弊检测模型,得到作弊检测结果。该方法能够扩展口考作弊检测的适用范围。
  • 一种基于声学表征矢量的样例关键词检索方法-201910462959.X
  • 张卫强 - 清华大学
  • 2019-05-30 - 2019-10-11 - G10L15/02
  • 本发明属于语音关键词检索技术领域,尤其涉及一种基于声学表征矢量的样例关键词检索方法,包括:步骤1:采用大量语音数据来训练得到带有瓶颈层的神经网络自编码器;步骤2:将神经网络自编码器的瓶颈层作为输出层来得到声学表征矢量提取器;步骤3:采用声学表征矢量提取器对单样例关键词和多样例关键词来提取关键词模型矢量;步骤4:采用声学表征矢量提取器对测试语言片段来提取测试语言声学表征矢量;步骤5:计算测试语言声学表征矢量与每个关键词模型矢量的距离,如果某距离小于预设门限,则该关键词即为检索的关键词。本发明适用于低资源条件下任意语种的单样例或多样例关键词检索的建模,检索性能高,并且单样例和多样例通用。
  • 会议语音数据处理方法、装置、计算机设备和存储介质-201910494580.7
  • 陈家荣 - 平安科技(深圳)有限公司
  • 2019-06-05 - 2019-10-11 - G10L15/02
  • 本申请涉及基于声纹识别的一种会议语音数据处理方法、装置、计算机设备和存储介质。该方法包括:接收终端发送的会议记录请求,根据会议记录请求向终端发送录音指令,获取终端上传的语音数据;对语音数据进行特征提取,得到多个语音特征信息;通过预设的声纹识别模型对语音特征信息进行声纹识别,得到多个语音片段和对应的声纹标识,并将多个语音片段转换为对应的文本信息;通过预设的语义分析模型分析出文本信息中的关键字和校正信息,根据校正信息对文本信息进行校正,并对校正后的文本信息添加对应的关键字;根据会议主题和添加关键字的文本信息按照预设方式生成对应的会议报告数据。采用本方法能够有效地提高会议语音数据的识别准确率。
  • 语音识别方法及其系统-201510017014.9
  • 李宏言 - 阿里巴巴集团控股有限公司
  • 2015-01-13 - 2019-10-01 - G10L15/02
  • 本发明涉及语音识别领域,公开一种语音识别方法及系统。语音识别方法包括以下步骤:对获取的N路语音信号分别进行频谱分析,得到多维的N路初步频谱特征参数,输入预先训练好的基于深层神经网络的听觉感知模型的N个实例中进行特征变换,得到N路经提练的听觉感知特征;将N路经提练的听觉感知特征的组合输入预先训练好的声学分类模型中,对输出进行解码以识别出语音信号所对应的文字内容。本发明中,通过对获取的多路语音信号分别进行频谱分析和特征变换,实现对听觉感知的互补作用,提取得到的听觉感知特征更符合人耳听觉感知的特点,能够提高语音识别准确率和抗噪能力。
  • 智能家居设备的语音控制方法及智能家居网关-201611020674.3
  • 张卓;盛文慧;禹超 - 海信集团有限公司
  • 2016-11-17 - 2019-09-20 - G10L15/02
  • 本发明公开了一种智能家居设备的语音控制方法及智能家居网关,属于智能家居领域。该方法包括:智能家居网关接收语音采集设备发送的语音信息,并对该语音信息进行语音识别处理,然后向目标智能家居设备发送控制指令,用于指示目标智能家居设备执行目标操作。通过该智能家居设备的语音控制方法,无需在每个智能家居设备上安装麦克风和语音识别装置,即可实现对智能家居设备的语音控制,从而降低语音控制智能家居设备的成本。另外,当用户发出语音信息时,用户的位置只需保证语音采集设备采集到该语音信息即可,无需保证用户的位置保持在该智能家居设备附近,增加了语音控制智能家居设备的灵活性。
  • 一种智能化英语发音自助学习系统-201910656536.1
  • 王萍;宫菲;王浩;赵颖;刘嫣然 - 山东劳动职业技术学院
  • 2019-07-19 - 2019-09-17 - G10L15/02
  • 本发明公开了一种智能化英语发音自助学习系统,包括标准数据模块、数据选择模块、数据采集模块、数据存储模块、数据分析模块、数据导出模块和强化模块。数据选择模块进行多级数据库分类,使用者根据需求选择相应的分级数据库,系统自动调取相应阶段、领域和难易程度的英语数据;将采集的语音数据存储到数据存储模块,数据分析模块将采集的语音数据进行语音识别,与标准声音数据进行对比反馈;数据导出模块根据分析结果,进行发音纠错,并且播报标准英语发音数据;强化模块调取数据库中相关单词,让使用者进行强化训练。本发明能为使用者进行自助英语发音练习并进行纠错及强化训练,显著提高发音水平。
  • 一种噪声环境下声纹识别的语音特征处理方法-201610125032.3
  • 张毅;谢延义;徐晓东;萧红;罗久飞;黄超;王可佳;倪雷 - 重庆邮电大学
  • 2016-03-04 - 2019-09-10 - G10L15/02
  • 本发明请求保护一种噪声环境下声纹识别的语音信号特征处理方法,包括步骤:(1)根据语音信号的特点对其进行信号的前期处理,包括语音信号的预加重,端点检测和加窗函数的选择;(2)估算发声个体的基音周期,并以此为依据对语音信号进行谱平滑处理,得到新的谱包络,计算通过梅尔滤波器的能量,最终通过离散余弦变换(DCT)计算得到梅尔平滑系数(SFCC)。(3)结合均值消减法、方差归一化、时间序列滤波法和加权自回归移动平均滤波法对SFCC进行后处理,得到回归平衡参数(MVDA);目的是通过平滑谱包络去除个体发声的不稳定因素和通过后处理算法去除环境噪声的影响,最终降低声纹识别的误识率。
  • 基于矢量泰勒级数的加性噪声与短时混响的联合补偿方法-201610812111.1
  • 吕勇 - 河海大学
  • 2016-09-08 - 2019-09-10 - G10L15/02
  • 本发明公开一种基于矢量泰勒级数的加性噪声与短时混响的联合补偿方法,从含噪混响语音的倒谱特征中估计纯净语音的倒谱特征。在训练阶段,用全部语音单元的训练语音生成一个高斯混合模型(GMM:Gaussian Mixture Model)。在测试阶段,首先用训练阶段得到的GMM从含噪混响语音的特征参数中估计混响参数和噪声参数;然后,用估得的混响参数和噪声参数对纯净语音GMM的参数进行变换,得到与含噪混响语音较为匹配的测试环境GMM;最后,用估得的测试环境GMM从含噪混响语音的特征参数中估计纯净语音的特征参数。本发明可以显著减小加性背景噪声和短时室内混响对语音识别系统的影响,增强语音识别系统的环境鲁棒性。
  • 一种语音识别方法及装置-201910476451.5
  • 晋博琛;刘永鑫 - 北京大牛儿科技发展有限公司
  • 2019-06-03 - 2019-09-06 - G10L15/02
  • 本发明公开了一种语音识别方法及装置,所述方法包括:1)、对待识别语音信号进行梅尔频率倒谱处理,得到梅尔频率特征序列;2)、使用预先训练的卷积神经网络对梅尔频率特征序列进行识别处理,得到语音特征序列;3)、针对语音特征序列中的当前语音特征,使用预先训练的递归神经网络根据当前时刻的递归神经网络隐态值和上一时刻的递归神经网络隐态对语音特征序列进行编码处理,得到识别结果;4)、将当前语音特征的下一语音特征作为当前语音特征,并返回执行步骤3),直至语音特征序列都被遍历,将所有的识别的集合作为目标识别结果。应用本发明实施例,实现了语音的流式识别。
  • 基于语音图谱和深度学习的实时性别识别方法-201910612980.3
  • 王磊 - 浙江百应科技有限公司
  • 2019-07-09 - 2019-09-06 - G10L15/02
  • 本发明涉及语音识别领域,尤其涉及于语音图谱和深度学习的实时性别识别方法,包括以下步骤:S1:基于深度学习算法建立模型;S2:语音对话过程中实时获取音频流;S3:将获取的音频流通过VAD切除静音部分;S4:通过fbank提取音频的数字特征;S5:将数字特征转换成语音图谱,将语音图谱通过模型进行性别预测,得到性别识别结果。本发明针对语音可以实时性别识别,同时提升了性别识别的准确率。
  • 语音识别方法及装置-201510996346.6
  • 孙廷玮 - 展讯通信(上海)有限公司
  • 2015-12-25 - 2019-09-06 - G10L15/02
  • 语音识别方法及装置,所述方法包括:将获取的待识别的声音数据划分为多个重叠的声音帧,并对每个声音帧进行快速傅立叶变换运算,得到对应的频谱;对所述多个重叠的声音帧的频谱进行遍历,将遍历到的当前声音帧的频谱划分为无重叠的多个子带;根据当前声音帧的多个子带的频谱能量,计算得到当前声音帧的能量均方根;当确定当前声音帧的能量均方根大于预设的阈值时,确定当前声音帧中包括语音信息。上述的方案,可以提高语音识别的速度和准确率。
  • 一种可快速记录会议内容并转换成文字的设备-201810192331.8
  • 付明涛;代蔚 - 付明涛
  • 2018-02-26 - 2019-09-03 - G10L15/02
  • 一种可快速记录会议内容并转换成文字的设备主要是通过对会议现场声音的实时收集,音频分析软件实时分析收集到的声音内容,将分析的结果转换成文字,经参会人员或会议记录人员修改、审核、整理后会议内容记录确定下来。由音频收集部分、音频分析部分、文字处理部分三个主要部分组成。音频收集部分主要是对会议现场的声音进行完整收集,音频分析部分主要是对收集到的音频数据进行分析并转换成文字。文字处理部分是对转换后的会议内容文字进行格式、内容的统一和校核。
  • 实现语音自动分类的方法及系统-201510752871.3
  • 胡尹;潘青华;高建清;胡国平;胡郁;刘庆峰 - 科大讯飞股份有限公司
  • 2015-11-06 - 2019-09-03 - G10L15/02
  • 本发明公开了一种实现语音自动分类的方法及系统,该方法包括:接收待分类语音数据;对待分类语音数据进行语音识别,得到识别文本;对所述待分类语音数据进行声学分析,得到声学上的分类特征;对所述识别文本进行内容分析,得到内容上的分类特征;利用所述声学上的分类特征、内容上的分类特征、以及预先构建的语音分类模型对所述待分类语音数据进行分类,得到所述待分类语音数据所属类型。利用本发明,可以减少人工工作量,并提高语音数据分类的准确率。
  • 一种应用于地空通信的话音识别方法-201910213205.0
  • 姚元飞;王群;陈洪瑀 - 成都天奥信息科技有限公司
  • 2019-03-20 - 2019-08-30 - G10L15/02
  • 本发明公开了一种应用于地空通信的话音识别方法,包括:建立地空通话三音素声学模型;通过改进的最大后验概率语音增强算法,对接收到的待识别的地空通信话音信号进行语音增强、去除背景噪声处理;将处理后的待识别地空通信话音信号,输入地空通话三音素声学模型进行识别,识别出管制员和飞行员的语音命令文本和关键词文本,当识别出的管制员与飞行员的语音命令文本不一致时进行告警提示;通过关键词检出模型对识别出的关键词文本进行检测,当检测到预设词汇时进行告警提示;本方法可识别管制人员和飞行员之间的话音命令并进行比对,还可以检测敏感词汇并告警提示,并且能够提高话音识别率。
  • 语音信号识别方法、装置及设备-201910459212.9
  • 刘溪;杨晓霞 - 大众问问(北京)信息科技有限公司
  • 2019-05-29 - 2019-08-30 - G10L15/02
  • 本发明实施例公开了一种语音信号识别方法、装置及设备。其中,该方法包括:获取音频信号,并计算每一帧音频信号的至少两个特征值,其中,所述音频信号中包括语音信号;对所述至少两个特征值进行分析,得到每个特征值的主成分特征值,其中,不同特征值的主成分特征值之间彼此不相关;从每一帧音频信号的每个主成分特征值中选择目标特征值;根据所述每一帧音频信号的目标特征值,识别音频信号中的语音信号。本发明实施例无需繁琐地进行大量数据的训练即可进行语音信号识别,而且同时保证鲁棒性强。
  • 一种语音识别、及语音识别模型训练方法及装置-201811251081.7
  • 王珺;苏丹;俞栋 - 腾讯科技(深圳)有限公司
  • 2018-10-25 - 2019-08-27 - G10L15/02
  • 本发明涉及计算机技术领域,尤其涉及一种语音识别、及语音识别模型训练方法及装置,该方法包括,从混合语音中识别出目标词语音,并基于所述目标词语音获得目标词语音的锚提取特征,将所述目标词语音的锚提取特征作为目标语音的锚提取特征;根据所述目标语音的锚提取特征,获得所述目标语音的掩码;根据所述目标语音的掩码,识别出所述目标语音,这样,根据混合语音中的目标词语音,来确定目标词语音对应的目标语音的锚提取特征,从而识别出目标语音,不需要预先知道或估计混合语音中说话人的数目,可以根据目标词识别和跟踪特定的目标语音,提高语音识别准确性,提升用户体验。
  • 语音识别方法、装置、计算机设备及存储介质-201910589578.8
  • 唐立亮 - 腾讯科技(深圳)有限公司
  • 2019-07-02 - 2019-08-20 - G10L15/02
  • 本发明公开了一种语音识别方法、装置、计算机设备及存储介质,属于人工智能技术领域。本发明通过基于每个数据包所承载语音消息的信号能量,确定第一数据包的有效指示信息,基于该有效指示信息获知该第一数据包承载有效语音消息的可能程度,在该有效指示信息满足第一目标条件时,仅基于第二数据包进行语音识别,减少了参与语音识别的数据包的数量,减少了运算时间;且基于该有效指示信息进行语音识别,避免了直接删除第一数据包导致的识别不准确的问题,因此在保证语音识别的准确率的前提下,提高了语音识别的效率。
  • 一种基于语音和群智感知的人群数量监测方法-201611014719.6
  • 阳小龙;洪鹭燕;孙奇福 - 北京科技大学
  • 2016-11-15 - 2019-08-20 - G10L15/02
  • 本发明公开了一种基于语音和群智感知的人群数量监测方法,通过对收集的语音片段取MFCC和Pitch等语音特征参数,再基于Pitch和MFCC联合特征参数进行性别识别、个体区分和人数统计,最后将人数统计的结果以热力图形式进行可视化显示。这样弥补了简单利用Pitch线性区分男女的不足,实现了人群规模监测,也提高了人群规模统计的快速性、准确性。
  • 基于声波信号的智能家居设备互联方法-201910238254.X
  • 孙伟卿;范庆磊;张卓 - 苏州蜜猪信息科技有限公司
  • 2019-03-27 - 2019-08-16 - G10L15/02
  • 本发明公开了智能家居设备语音控制领域的一种基于声波信号的智能家居设备互联方法,包括语音捕获模块、信号转换模块、数据处理模块及语音识别模块,语音识别模块包括依赖语音识别模块以及独立语音识别模块,当语音信号为依赖型语音信号时,依赖语音识别模块将语音信号通过激活指令模块使各个音频终端激活,独立语音识别模块再通过激活指令模块将语音信号下发到对应音频设备进行控制;当语音信号为独立型语音信号时,独立语音识别模块直接通过激活指令模块将语音信号下发到对应音频设备进行控制。本发明可以解决不同品牌或类型的智能设备之间的互联和相互协作问题,实现对不同平台或系统的控制指令合成并下发控制指令的功能。
专利分类
×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

400-8765-105周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top