[发明专利]基于声纹信息的身份认证及识别方法有效

专利信息
申请号: 201810928479.3 申请日: 2018-08-15
公开(公告)号: CN109036435B 公开(公告)日: 2022-12-20
发明(设计)人: 余伟;赵静芝;李家虎;施文杰;胡发泽 申请(专利权)人: 深圳平安综合金融服务有限公司上海分公司
主分类号: G10L17/00 分类号: G10L17/00;G10L17/04;G10L21/0208
代理公司: 上海专利商标事务所有限公司 31100 代理人: 陆嘉
地址: 200040 上海市静安区上*** 国省代码: 上海;31
权利要求书: 查看更多 说明书: 查看更多
摘要: 发明揭示了一种基于声纹信息的身份认证及识别方法,包括如下的步骤:声纹注册步骤,获取用户的声纹信息,将声纹信息与分类信息以及用户的个人信息相关联。声纹存储步骤,依据分类信息将声纹信息存储到相应的分类声纹库中,分类声纹库具有分类特征。分类权重计算步骤,在指定的业务场景下对用户进行身份认证识别时,根据业务场景计算各个分类声纹库各自的分类权重。声纹比对步骤,获取用户的当前声纹,在各个分类库中查找与当前声纹相匹配的声纹信息。声纹认证识别步骤,根据相匹配的声纹信息以及存储该声纹信息的分类声纹库的分类权重,计算声纹认证值,将具有最高声纹认证值的声纹信息认证为用户的身份,并获取与该声纹信息相关联的用户的个人信息。
搜索关键词: 基于 声纹 信息 身份 认证 识别 方法
【主权项】:
1.一种基于声纹信息的身份认证及识别方法,其特征在于,包括:声纹注册步骤,获取用户的声纹信息,将声纹信息与分类信息以及用户的个人信息相关联;声纹存储步骤,依据分类信息将声纹信息存储到相应的分类声纹库中,各个分类声纹库具有各自的分类特征;分类权重计算步骤,在指定的业务场景下对用户进行身份认证识别时,根据业务场景计算各个分类声纹库各自的分类权重,分类权重是根据分类声纹库的分类特征与业务场景的关联度确定;声纹比对步骤,获取用户的当前声纹,在各个分类库中查找与当前声纹相匹配的声纹信息;声纹认证识别步骤,根据相匹配的声纹信息以及存储该声纹信息的分类声纹库的分类权重,计算声纹认证值,将具有最高声纹认证值的声纹信息认证为用户的身份,并获取与该声纹信息相关联的用户的个人信息。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于深圳平安综合金融服务有限公司上海分公司,未经深圳平安综合金融服务有限公司上海分公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/patent/201810928479.3/,转载请声明来源钻瓜专利网。

同类专利
  • 一种二值权重卷积神经网络模块及其用于声纹识别的方法-202110060392.0
  • 刘波;吴海舸;张轩;蔡浩;葛伟;杨军 - 东南大学
  • 2021-01-18 - 2023-10-24 - G10L17/00
  • 本发明公开了一种二值权重卷积神经网络模块及其用于声纹识别的方法。属于人工智能神经网络技术领域。其功能为对采集到的语音特征进行二值化的卷积计算与全连接计算,采用符号判断方式判断输入语音中是否含有目标说话人,并输出判断结果。其核心结构包括地址生成单元、状态机控制单元和复用计算单元。本发明采用二值化的卷积神经网络,极大减少了计算过程中的乘法操作,通过状态机控制单元控制整个网络的操作,通过判断全连接神经元的符号进行说话人判断,简单有效。模块化程度高,结构简单,可行性好,实现了较好的声纹识别效果同时有效降低了整体计算的功耗和延时。
  • 面向自动声纹识别系统的黑盒定向对抗攻击方法及系统-202110411559.3
  • 孙蒙;张星昱;张雄伟;邹霞;贾冲;李莉;康凯;王彬 - 中国人民解放军陆军工程大学
  • 2021-04-16 - 2023-09-26 - G10L17/00
  • 本发明公开了一种面向自动声纹识别系统的黑盒定向对抗攻击方法及系统,包括:根据不同的说话人识别任务确定对应的损失函数;将源说话人的语音、需要被攻击的说话人识别模型、采样点个数、对抗样本生成算法的初始参数以及对应的损失函数,输入到对抗样本生成算法,生成语音扰动;将语音扰动添加到源说话人语音上生成对抗样本。优点:不需要获取说话人识别系统神经网络的结构信息和内部梯度信息,只需要获取说话人识别系统输出的识别结果及打分;只在部分语音采样点上添加对抗样本扰动,可以避免在静音段添加扰动,从而影响对抗样本的不可感知性;避免了倒谱特征转换回语音波形时产生的信息损失,从而避免了语音质量的下降。
  • 说话者识别系统及说话者识别方法及入耳式装置-201780000606.7
  • 黄彦颖 - 深圳市汇顶科技股份有限公司
  • 2017-07-03 - 2023-09-22 - G10L17/00
  • 一种说话者识别系统(10),包括一入耳式装置(100),置入一使用者的一外耳道,入耳式装置(100)包括一收音器(102),用来接收来自外耳道的一耳道声波,以产生对应于耳道声波的一耳道声信号;一声频处理模块(106),耦接于收音器(102),用来自耳道声信号中撷取对应于使用者的声纹特征,以产生一声纹特征信号;以及一终端装置(120),用来根据声纹特征信号,判断使用者是否为一认证用户。
  • 声纹识别方法和装置、存储介质、电子设备-202011205650.1
  • 李红岩;刘岩;关春生;党莹;黄洪运 - 泰康保险集团股份有限公司
  • 2020-11-02 - 2023-09-12 - G10L17/00
  • 本发明实施例是关于一种声纹识别方法和装置、存储介质、电子设备,涉及声纹识别领域,该方法包括:根据待识别音频的第一有效音频以及第二有效音频得到符合预设时长的第三有效音频;其中,所述第一有效音频的时长小于所述预设时长;对所述第三有效音频进行特征提取,得到所述第三有效音频的特征向量;根据所述特征向量生成所述第三有效音频的声纹验证模型,并基于所述声纹验证模型,对所述第三有效音频进行匹配,得到匹配结果;根据所述匹配结果中包括的属性信息,确定与生成待识别音频对应的用户,并根据所述用户的标识信息,为所述用户匹配对应的用户服务。本发明实施例提高了声纹识别的成功率。
  • 识别装置、识别方法以及程序-202180088414.2
  • 土井美沙贵 - 松下电器(美国)知识产权公司
  • 2021-12-03 - 2023-09-05 - G10L17/00
  • 识别装置(10)具备:获得部(11),获得声音数据;识别部(12),通过讲话者识别处理来获得示出相似度的分数,上述相似度是获得部(11)所获得的声音数据和规定的讲话者的讲话所涉及的声音数据的相似度;以及校正部(13),在判断为获得部(11)所获得的声音数据具有使由识别部(12)进行的讲话者识别处理的识别性能下降的特征的情况下,对上述分数实施使上述分数所受到的识别性能的下降的影响减小的校正处理后并输出。
  • 音频数据处理方法、装置、存储介质及电子设备-202010457129.0
  • 毕成 - 同盾控股有限公司
  • 2020-05-26 - 2023-09-05 - G10L17/00
  • 本发明实施例提供一种音频数据处理方法、装置、存储介质及电子设备,该方法包括:获取目标音频数据的频谱特征;利用神经网络模型的第一卷积模块对频谱特征进行卷积处理,获取第一卷积处理结果,第一卷积模块包括第一层归一化层;利用第一激活模块对第一卷积处理结果进行激活处理,获取第一激活处理结果;利用第二卷积模块对第一激活处理结果进行卷积处理,获取第二卷积处理结果,第二卷积模块包括第二层归一化层;利用第二激活模块对第二卷积处理结果以及频谱特征进行激活处理,获取目标音频数据的目标声纹特征;基于目标声纹特征与注册的声纹特征进行打分,确定目标音频数据对应的对象信息。提升了声纹识别的效率和准确性。
  • 一种声纹向量提取方法、装置、设备及存储介质-202110505478.X
  • 李晋;方昕;褚繁;高天;戴礼荣 - 科大讯飞股份有限公司
  • 2021-05-10 - 2023-08-01 - G10L17/00
  • 本申请提供了一种声纹向量提取方法、装置、设备及存储介质,方法包括:获取目标语音数据对应的语谱片段序列,基于语谱片段序列和预先建立的第一声纹提取模型确定声纹向量,第一声纹提取模型以第一训练语谱片段为训练样本,采用第二声纹提取模型辅助训练得到,第一声纹提取模型的训练目标包括:使基于第一声纹向量和第二声纹向量分别针对设定身份标签预测的概率趋于一致,第一声纹向量为第一声纹提取模型针对第一训练语谱片段提取的声纹向量,第二声纹向量为第二声纹提取模型针对第二训练语谱片段提取的声纹向量,第二训练语谱片段为对第一训练语谱片段的时序进行打乱后的语谱片段。本申请提供的声纹向量提取方法不受语音时序信息的干扰。
  • 声纹注册方法、装置、计算设备及介质-202210062026.3
  • 刘佳杨;史润宇 - 北京小米移动软件有限公司
  • 2022-01-19 - 2023-07-28 - G10L17/00
  • 本公开提供一种声纹注册方法、装置、计算设备及介质,属于音频处理技术领域。本公开通过在获取到用于声纹注册的注册音频后,通过与注册音频的信噪比数值对应的数据增强处理方式,来对注册音频进行数据增强处理,从而得到音频质量较好的目标音频,从而综合目标音频对应的特征向量,以及注册音频对应的特征向量,来实现声纹特征的确定,提高所确定出的声纹特征的复杂度,使得所确定出的声纹特征具有较强的抗干扰能力,进而基于所确定出的目标特征向量,来为注册音频进行声纹注册,以提高后续基于声纹特征进行声纹识别的过程的准确性。
  • 基于知识图谱和声纹识别的认证方法、装置、设备及介质-202010723015.6
  • 邹芳;李俊蓉;李沛恒 - 中国平安人寿保险股份有限公司
  • 2020-07-24 - 2023-07-21 - G10L17/00
  • 本发明涉及人工智能领域,提供一种基于知识图谱和声纹识别的认证方法、装置、设备及介质,所述方法包括:通过获取身份验证指令中的用户信息;获取用户样音信息和用户知识图谱;获取第一认证问题生成模型生成待确认问题;通过语音转换模型得到的认证问题语音;接收到回复语音信息,获取声纹识别模型根据回复语音信息和用户样音信息输出的声纹匹配结果;通过回复识别模型对回复语音信息进行文本识别及意图识别,得到回复结果,再识别出待确认问题与回复结果的匹配度,获得答复综合结果;确定本轮对话中的身份认证结果。本发明实现了双重认证,增强了用户信息的安全性,本发明还涉及区块链技术,本发明中的用户知识图谱可存储于区块链中。
  • 一种识别说话人的方法及终端-201810889916.5
  • 贾雪丽;王健宗;肖京 - 平安科技(深圳)有限公司
  • 2018-08-02 - 2023-07-07 - G10L17/00
  • 本发明适用于计算机技术领域,提供了一种识别说话人的方法及终端,该方法包括:获取待识别的目标声音信息;使用预设的神经网络模型对目标声音信息进行处理,提取目标声音信息的目标特征向量;使用所述神经网络模型对所述目标特征向量进行处理,得到目标特征向量与标签向量之间的损失值,所述损失值包括角度损失值以及距离损失值;基于所述损失值,确定所述目标声音信息对应的身份识别结果。本发明实施例,使用预设的神经网络模型提取待识别的目标声音信息的目标特征向量,能够准确提取说话人的语音特征,通过计算目标特征向量与标签向量之间的损失值,能够准确分析声音信息的特征向量与已知的标签向量之间的差异,提高身份识别结果的准确度。
  • 一种机器辅助的会议记录系统及方法-202110378334.2
  • 田金钊;程帆;符鸿飞 - 上海交通大学
  • 2021-04-08 - 2023-06-30 - G10L17/00
  • 本发明涉及一种机器辅助的会议记录系统,包括:麦克风收音阵列:用以实时拾取会议的音频数据;音频预处理模块:对录入的音频数据进行分割和预处理,并且将预处理过的音频数据分别送入声纹识别模块以及语音处理系统模块中;声纹识别模块:用以判断音频数据中每句话所属说话人身份信息,并且为每句话匹配说话人身份标签;语音识别模块:用以将音频数据转换为文字信息;综合处理模块:用以组合声纹识别模块与语音识别模块的输出内容,并发送给终端界面;可实时交互处理的终端界面:用以实时进行操作处理,显示会议记录信息,依据机器生成的内容,实时进行纠错改正。与现有技术相比,本发明实时检错、自动生成,避免二次审查造成时间浪费。
  • 一种个性化信息识别方法、装置、电子设备及存储介质-201911320518.2
  • 罗景 - 五八有限公司
  • 2019-12-19 - 2023-06-27 - G10L17/00
  • 本申请公开了一种个性化信息识别方法、装置、电子设备及存储介质,对语音交互行为信息对应的语音片段进行声纹识别处理,得到与每个用户对应的个体用户声纹序列。根据个体用户声纹序列的所属时间范围,将该时间范围对应的操作交互行为信息和个体用户声纹序列构建个体用户完整行为序列数据,进而确定每个用户的个性化信息。可见,本发明提供的方法,可以提取多个用户与智能设备在语音交互过程中的声纹片段,根据声纹片段将每个用户的操作交互行为信息进行聚合,构建个体用户完整行为序列数据,进而进行个体用户的个性化偏好生成,该方法可以在多用户与智能设备进行语音交互时,实现针对每个个体用户进行对应的个性化信息识别,准确性好。
  • 一种信息处理方法及电子设备-201911424331.7
  • 黄海峰 - 联想(北京)有限公司
  • 2019-12-31 - 2023-06-23 - G10L17/00
  • 本申请涉及一种信息处理方法及电子设备,所述方法及电子设备在获得对至少一个发音对象产生的音频进行采集所得的语音数据后,可从中确定出符合对象条件的至少一个目标发音对象所对应的符合数据条件的目标语音数据,并对确定出的目标发音对象的目标语音数据进行数据信息记录,从而,针对会议等多人讲话场景,基于本申请方案,可实现从多个讲话人发出的语音数据中提炼出重要讲话人的讲话纪要,能有针对性地抓取重要讲话人的语音数据中的重点信息,为会议等多人讲话场景中重要讲话人的讲话重点、纪要信息的有效提炼与实时发布提供了方便。
  • 一种歌曲演唱过程中的用户身份识别方法及存储介质-202010385275.7
  • 陈勇;王子亮;邹应双;林剑宇;刘旺 - 福建星网视易信息系统有限公司;福建凯米网络科技有限公司
  • 2020-05-09 - 2023-06-02 - G10L17/00
  • 本发明涉及语音识别技术领域,特别涉及一种歌曲演唱过程中的用户身份识别方法及存储介质。所述一种歌曲演唱过程中的用户身份识别方法,包括步骤:获取歌曲中每段原声演唱的起止时间段;采集歌曲播放过程中原声演唱起止时间段中音频输入设备的输入音频,并计算所述输入音频的声纹信息;将所述声纹信息与预存的声纹模型进行匹配;优先将匹配度高的声纹模型对应的用户标记为当前演唱用户。通过该方式,无需用户每演唱一首歌,就手动输入身份信息,而是当用户开口演唱时,会自动获取其声音并计算得其声纹信息,进而根据声纹信息在系统预存的声纹模型中寻找与其匹配度高的用户,将该用户标记为当前演唱用户。
  • 基于生物特征的声源追踪方法、装置、设备及存储介质-201811504484.8
  • 任婧;胡文成;曾燕玲 - 平安科技(深圳)有限公司
  • 2018-12-10 - 2023-06-02 - G10L17/00
  • 本发明公开了一种基于生物特征的声源追踪方法、装置、设备及存储介质,所述方法包括:获取当前环境中符合预设声源要求的声源,提取所述声源中的第一声纹特征,并标记该声源所在的声源位置;获取所述声源位置周围预设范围内的人脸,并判断该人脸是否正在说话;若该人脸正在说话,获取该人脸的说话音频,并提取所述说话音频中的第二声纹特征;在确定所述第二声纹特征与所述第一声纹特征匹配时,将该人脸设定为追踪对象。本发明结合声源定位、人脸检测和声纹识别等来实现对追踪对象的追踪定位,提升了追踪的定位效果,提高了追踪的准确性。
  • 设备绑定方法和装置及系统、存储介质-201911339869.8
  • 母世;徐世超;梁志婷 - 秒针信息技术有限公司
  • 2019-12-23 - 2023-05-30 - G10L17/00
  • 本发明公开了一种设备绑定方法和装置及系统、存储介质。其中,该方法包括:检测语音采集设备的运动状态;在运动状态指示语音采集设备处于运动中的情况下,控制语音采集设备进入绑定准备状态,并获取语音采集设备在绑定准备状态下采集到的目标语音信息;在目标语音信息中识别出目标对象的身份标识信息的情况下,将目标对象的身份标识信息与语音采集设备的设备标识进行绑定。本发明解决了相关技术中设备绑定操作复杂度较高的技术问题。
  • 多媒体资源的推荐方法、装置、设备及存储介质-202310180566.6
  • 曾亮;涂贤玲 - 北京声智科技有限公司
  • 2023-02-15 - 2023-05-26 - G10L17/00
  • 本申请提供了一种多媒体资源的推荐方法、装置、设备及存储介质,属于人工智能技术领域。方法包括:接收第一语音指令;将第一语音指令的声纹特征与至少一个第一对象的声纹特征进行匹配,第一对象为多媒体资源收听范围被限制的对象;若至少一个第一对象中存在目标对象,基于目标对象的限制资源列表,为目标对象推荐目标对象的限制资源列表以外的多媒体资源,目标对象的声纹特征与第一语音指令的声纹特征匹配,目标对象的限制资源列表用于存储限制目标对象收听的多媒体资源。该方法避免了为对象推荐限制其收听的多媒体资源,进而能够保证为多媒体资源收听范围被限制的对象推荐合适的多媒体资源,提高了多媒体资源推荐的有效性。
  • 一种声纹鉴定方法和相关装置-201980003350.4
  • 郑琳琳 - 广州国音智能科技有限公司
  • 2019-12-24 - 2023-05-26 - G10L17/00
  • 本申请公开了一种声纹鉴定方法和相关装置,通过计算样本语音中的目标音素与检材语音中的目标音素的共振峰频率偏差,得到4个偏差值,当偏差值不满足预置共振峰频率偏差标准时,计算偏差值与共振峰频率偏差标准中与该偏差值对应的共振峰频率偏差上限值的差值,判断差值是否在预置范围内,若是,调整样本语音中的目标音素的音频时间范围,直至满足条件,从而输出样本语音中的目标音素与检材语音中的目标音素属于同一说话人的声纹鉴定结果,否则输出不同说话人的声纹鉴定结果,从而解决了现有的声纹鉴定方法中说话人因为情绪波动等原因使得计算得到的偏差值与预置范围存在微小的偏差,进而使得原本为同一说话人被错鉴定为不同说话人的技术问题。
  • 声音采集方法、装置及设备和存储介质-202110343578.7
  • 肖启华;莫志坚 - 联想(北京)有限公司
  • 2021-03-30 - 2023-05-23 - G10L17/00
  • 本申请实施例公开了一种声音采集方法、装置及设备和存储介质,先收集第一方向的声音信号,如果第一方向的声音信号中包括第一人的语音信号,确定第一人所在的第二方向;收集第二方向的声音信号,以及第三方向的声音信号;其中,第一方向的覆盖范围大于第三方向的覆盖范围,第三方向的覆盖范围大于第二方向的覆盖范围;第二方向的覆盖范围属于第三方向的覆盖范围的子覆盖范围,第三方向的覆盖范围属于第一方向的覆盖范围的子覆盖范围;对在第二方向收集的声音信号进行识别,以确定第一人的语音信号;对在第三方向收集的声音信号中的语音信号进行特征参数提取,该特征参数用于区分不同人的语音信号。在降低了功耗的同时,保持声音采集的连续性。
  • 基于WMFCC和DNN的帕金森患者声纹识别方法-201811083605.6
  • 张颖;徐志京 - 上海海事大学
  • 2018-09-18 - 2023-05-12 - G10L17/00
  • 本发明提出了一种利用WMFCC提取人们的声纹特征、DNN识别并分类的方法,用于区分帕金森患者和健康人。WMFCC通过计算患者声纹中倒谱系数的加权和系数,解决高阶倒谱系数小、特征分量对音频的表征能力差等问题。DNN训练并分类识别有效地提高系统精度,使用MBGD优化算法降低损失函数的计算量进而提高系统训练速度。利用PD(帕金森)database中样本训练并测试分类,提高了判别帕金森患者的准确率,为帕金森患者早期快速辅助诊断提供了良好的解决方案。
  • 语音认证方法和信息处理设备-201810301678.1
  • 刘柳;石自强;刘汝杰 - 富士通株式会社
  • 2018-04-04 - 2023-05-05 - G10L17/00
  • 提供了语音认证方法和信息处理设备。信息处理设备包括处理器,处理器被配置为:从预定元素集中随机选择至少一个元素;得到被测用户对所选元素的语音输入;将被测用户对每个所选元素的语音输入输入到预训练的神经网络模型,并提取该神经网络模型的一个层的输出数据,作为能够表征被测用户身份以及该元素的综合特征;将所获得的被测用户的关于每个所选元素的综合特征与基于特定用户对该元素的语音输入利用预训练的神经网络模型获得的综合特征进行比较,以至少部分地基于综合特征比较的结果判断被测用户是否为特定用户,其中,预训练的神经网络模型是利用训练语音数据通过以识别说话人身份和预定元素集中的元素作为联合任务进行训练而获得的。
  • 基于深度学习的文本无关多标号说话人识别方法-202010563201.8
  • 邓克琦;卢晶 - 南京大学
  • 2020-06-19 - 2023-05-05 - G10L17/00
  • 本发明公开了一种基于深度学习的文本无关多标号说话人识别方法。该方法包括以下步骤:(1)将训练数据集中每个说话人的语音平均分成N份,每份标记上不同的标号;(2)构建相应的神经网络模型,并保证输出层维度与训练数据集标号数一致;(3)将训练数据输入神经网络,并将输出层结果与数据对应的标号相比较,求出交叉熵损失函数,从而进行训练;(4)将测试集数据按照步骤1中训练数据集对应关系为每个说话人的语音数据预设好N个视为有效识别的标号,将测试数据集数据输入神经网络,将模型预测出的标号与预设好的N个标号相比较,只要满足其中之一即为正确识别。本发明的方法能够有效提升模型在纯净以及含噪环境下的说话人识别性能。
  • 一种控制语音确定方法、控制语音确定装置和集成灶-202111260068.X
  • 孔凡军;王善旭;付成冲;邓鹏飞 - 青岛海尔智慧厨房电器有限公司;海尔智家股份有限公司
  • 2021-10-28 - 2023-05-02 - G10L17/00
  • 本发明实施例公开了一种控制语音确定方法、控制语音确定装置和集成灶,该控制语音信息确定方法包括:实时接收第一语音信息和第二语音信息,所述第一语音信息包括控制语音信息和环境噪声信息,所述第二语音信息包括所述环境噪声信息;根据所述第二语音信息确定环境噪声滤除信息;根据所述环境噪声滤除信息和所述第一语音信息确定所述控制语音信息。本发明实施例提供的控制语音信息确定方法,通过同时接收控制语音信息和环境噪声信息,再消除环境噪声信息即可识别到控制语音,提高了语音识别效果,避免语音识别过程中受到环境噪声的干扰,提升用户的使用体验。
  • 快速识人方法、装置、终端、智能头戴设备、介质及系统-202211573747.7
  • 陈林;王勇;钟安妮 - 湖北星纪时代科技有限公司
  • 2022-12-08 - 2023-05-02 - G10L17/00
  • 本申请公开了一种快速识人方法、装置、终端、智能头戴设备、介质及系统。所述方法包括:发送识别指令到智能头戴设备,以使所述智能头戴设备获取目标对象的声音数据;接收所述智能头戴设备发送的声音数据;将所述声音数据转发至云端服务器,以使云端服务器根据声音数据进行声纹匹配确定目标名片信息;接收所述云端服务器发送的目标名片信息;将所述名片信息发送至所述智能头戴设备,以使所述智能头戴设备显示所述名片信息给智能头戴设备佩戴者。该方法通过智能头戴设备获取目标对象的名片信息,并将名片信息显示在智能头戴设备上,能够使智能头戴设备佩戴者识别他人的身份信息。
  • 基于会议实录系统的防串音方法、电子装置及存储介质-202010235796.4
  • 陈先丽;肖金平;万正勇;沈志勇 - 招商局金融科技有限公司
  • 2020-03-30 - 2023-05-02 - G10L17/00
  • 本发明涉及数据处理技术,提供了一种基于会议实录系统的防串音方法、电子装置及存储介质。该方法通过实时获取发言者的语音信息,并将语音信息输入预先训练的声纹识别模型得到发言者的实时语音特征,判断预先建立的声纹库中是否存在发言者的预存语音特征,当存在时,从声纹库中读取发言者的语音特征及对应的标签,基于预先建立的每个麦克风与每个发言者标签的映射关系,得到发言者的语音特征对应的麦克风,实时检测多个麦克风是否发生串音现象,当多个麦克风中任意一个麦克风发生串音现象时,对发生串音的麦克风执行防串音处理操作。利用本发明,可以准确地检测出发生串音的麦克风,以对发生串音的麦克风执行防串音处理。
  • 音频识别的方法、装置、电子设备及存储介质-202011553762.6
  • 赵情恩;曾新贵;熊新雷;陈蓉;肖岩;李旭 - 北京百度网讯科技有限公司
  • 2020-12-24 - 2023-05-02 - G10L17/00
  • 本申请公开了音频识别的方法、装置、电子设备及存储介质,涉及人工智能、深度学习、语音识别领域。具体实现方案为:对目标多媒体资源进行人声分离,获取目标多媒体资源中的每个发声人的声纹;将目标多媒体资源中的每个发声人的声纹与声纹库中的预存声纹进行匹配,预存声纹为目标类别人物的声纹;在匹配成功的情况下,确定目标多媒体资源中包含目标类别人物的音频。本申请通过人声分离的方式可以从目标多媒体资源中准确的获取到每个发声人的音频,进而保证每个发声人的音频均能够与声纹库中目标类别人物的声纹进行匹配,提高了目标多媒体资源的检测准确率。
  • 一种用于声纹探头的安装组件-202222968717.8
  • 严戴志;周翔;熊飞;陈驰;余林;周佳 - 国能大渡河流域水电开发有限公司龚嘴水力发电总厂
  • 2022-11-08 - 2023-05-02 - G10L17/00
  • 本实用新型公开了一种用于声纹探头的安装组件,包括声纹探头、立杆、第一卡箍、第二卡箍、第一连接块和第二连接块,所述立杆位于声纹探头的底部。本实用新型通过设置连接机构和限位机构,通过连接机构对第一卡箍和第二卡箍起到连接的作用,使声纹探头连接在立杆的表面,通过限位机构对第一卡箍和第二卡箍起到限位的作用,使声纹探头起到在立杆表面固定的作用,具备快速安装拆卸的优点,解决了现有通过螺丝和螺纹将声纹探头固定在监控杆的表面,但是在安装或者拆卸时,需要使用螺丝刀才能够安装拆卸,安装拆卸较繁琐,且使用者在监控杆的高度进行繁琐的安装拆卸具有安全隐患的问题。
  • 声纹样本采集方法、装置、计算机设备及存储介质-201811339705.0
  • 朱文和 - 平安科技(深圳)有限公司
  • 2018-11-12 - 2023-04-28 - G10L17/00
  • 本发明公开了一种声纹样本采集方法、装置、计算机设备及存储介质。所述方法包括:获取声纹采集请求中包含的台词情绪标签;从预设的台词数据库中选取台词情绪标签对应的台词文本,并将台词文本发送到客户端;接收客户端返回的采集用户朗读台词文本的语音数据;对语音数据进行有效性校验,若有效性校验通过,则将语音数据转换为语音文本;对语音文本和台词文本进行文本相似度匹配;若匹配结果为匹配成功,则提取所述语音数据的声纹特征,将声纹特征、台词情绪标签和台词文本作为声纹样本,并关联保存到声纹情绪识别模型对应的样本库中。本发明的技术方案通过台词情绪标签有针对性的采集声纹情绪识别模型的声纹样本,降低采集成本,提高采集效率。
  • 声纹识别的方法、装置、设备、存储介质以及程序产品-202011545572.X
  • 赵情恩;曾新贵;熊新雷;陈蓉 - 北京百度网讯科技有限公司
  • 2020-12-24 - 2023-04-07 - G10L17/00
  • 本公开提供了一种声纹识别的方法、装置、设备、存储介质以及程序产品,涉及大数据以及语音识别等领域。具体实现方案为:获取多个对话音频,各对话音频中分别包括有第一发言人的语音片段和第二发言人的语音片段;根据各对话音频对应的第一发言人的身份标识,将多个对话音频划分为多组,每组对话音频对应于相同的第一发言人;对目标组对话音频中各语音片段的声纹进行聚类,得到多个聚类结果;选取包含语音片段数量最多的聚类结果确定为候选聚类结果;将候选聚类结果对应的声纹确定为目标组对话音频对应的第一发言人的声纹。根据本公开的声纹识别的方法具有人力成本低、声纹的提取及识别效率高等优点,有利于缩减声纹库的建立周期。
专利分类
×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

400-8765-105周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top