[发明专利]一种声纹识别的认证方法和装置以及设备在审

专利信息
申请号: 202010293634.6 申请日: 2020-04-15
公开(公告)号: CN111444377A 公开(公告)日: 2020-07-24
发明(设计)人: 肖龙源;李稀敏;刘晓葳;谭玉坤;叶志坚 申请(专利权)人: 厦门快商通科技股份有限公司
主分类号: G06F16/61 分类号: G06F16/61;G06F21/32;G10L17/00;G10L17/06;G10L17/02
代理公司: 厦门原创专利事务所(普通合伙) 35101 代理人: 梁英
地址: 361000 福建省厦门市*** 国省代码: 福建;35
权利要求书: 查看更多 说明书: 查看更多
摘要: 发明公开了一种声纹识别的认证方法和装置以及设备。其中,所述方法包括:采集至少一个用户的语音数据和个人特征,对该语音数据进行声纹特征提取,根据该个人特征和声纹特征,构建关联该个人特征的至少一个共性特征的声纹特征数据库,对该构建的声纹特征数据库按共性特征的数量进行优先级排序,根据待测声纹特征对应的用户的个人特征,从该经优先级排序后的声纹特征数据库中,识别出与该待测声纹特征相似度最高的声纹特征对应的用户为待认证用户,对该经优先级排序后的声纹特征数据库中的该待认证用户的声纹特征进行认证。通过上述方式,能够实现提高声纹识别的认证效率。
搜索关键词: 一种 声纹 识别 认证 方法 装置 以及 设备
【主权项】:
暂无信息
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于厦门快商通科技股份有限公司,未经厦门快商通科技股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/patent/202010293634.6/,转载请声明来源钻瓜专利网。

同类专利
  • 曲库更新方法、装置、终端和非临时性计算机可读存储介质-202010301377.6
  • 杨华东;生羽亭;于绞龙;王盟盟 - 北京雷石天地电子技术有限公司
  • 2020-04-16 - 2023-10-24 - G06F16/61
  • 本发明涉及计算机网络和数据库领域,提供了曲库更新方法、装置、终端和非临时性计算机可读存储介质,以节省流量并及时更新曲库。所述方法包括:周期性地根据从云端请求的歌曲相关资源信息,对原始曲库依次执行新增歌曲数据插入、冷门歌曲数据删除、歌星信息插入和歌曲下架任务,得到初步更新曲库;对初步更新曲库进行歌曲列表和歌星列表的整理,得到整理后更新曲库;检查整理后更新曲库,若无错误,则将整理后更新曲库作为最终更新曲库。本发明提供的技术方案在对曲库更新时耗费的流量比较小,而且能够及时更新曲库。
  • 语音特征提取的查表方法、装置、计算机设备和存储介质-201910970179.6
  • 彭博;高婧洁;顾渝骢 - 杭州智芯科微电子科技有限公司
  • 2019-10-12 - 2023-10-20 - G06F16/61
  • 本发明公开了语音特征提取的查表方法、装置、计算机设备和存储介质,其中,对语音识别模型中关联的预设非线性函数进行二阶导数绝对值处理,依据预设精度设置初始值和间隔,生成索引值和结果值,将该索引值和结果值存入待查询的表格;接收该语音识别模型的目标值,依据该目标值查询该表格,得到与该目标值对应的该结果值,解决了语音特征提取方法中,查表法消耗大量内存,造成电量和存储空间浪费的问题,节省了电量和提高了存储空间的利用率。
  • 音频文件确定方法和装置、存储介质及电子装置-201911401929.4
  • 刘浩;黄杰辉;梁志婷 - 秒针信息技术有限公司
  • 2019-12-30 - 2023-10-03 - G06F16/61
  • 本发明提供了一种音频文件确定方法及装置,其中,上述方法包括:对N个关键词集合中的每个关键词集合中的所有关键词进行排序,得到N个关键词集合对应的N个关键词排序结果,其中,N个关键词集合与N个音频文件一一对应,N为自然数;根据N个关键词排序结果确定N个关键词排序结果中相似度超过第一预设阈值的M个关键词排序结果,其中,M为小于或等于N的自然数;确定M个关键词排序结果对应的M个音频文件为M个目标音频文件。采用上述技术方案,解决了相关技术中,在通过使用录音设备判断员工服务质量的过程中,如何判断录音作弊的行为的问题。
  • 一种通过音频查找曲谱的方法及系统-202110161081.3
  • 孙飞龙 - 小叶子(北京)科技有限公司
  • 2021-02-05 - 2023-09-12 - G06F16/61
  • 本发明公开了一种通过音频查找曲谱的方法,包括:将待查找音频转换成MIDI文件,并提取音高形成待查找音高序列;将待查找音高序列中的音高组成待查找节点,形成待查找节点序列;将待查找节点序列中的节点组成待查找索引节点,形成待查找索引节点序列;在曲谱库中分别查找待查找索引节点序列中每个待查找索引节点对应的曲谱ID,得到第一结果列表;将待查找音高序列和第一结果列表中每个曲谱ID对应的音高序列进行连续性匹配,得到第二结果列表;根据第二结果列表,确定待查找音高序列对应的曲谱ID,并获取曲谱的相关信息。本发明还公开了一种通过音频查找曲谱的系统。本发明通过音频能在曲谱库中查找到相应的曲谱及相关信息。
  • 一种基于深度哈希的声纹检索方法-201910574215.7
  • 李武军;樊磊;蒋庆远;余亚奇 - 南京大学
  • 2019-06-28 - 2023-08-08 - G06F16/61
  • 本发明公开了一种基于深度哈希的声纹检索方法,达到了声纹检索任务中存储空间低且检索高效的效果。该方法包括训练深度声纹哈希模型的步骤,构建哈希编码数据库的步骤,对查询语音在数据库中检索的步骤:首先构建端到端的深度神经网络结构,利用已标注过说话人身份的语音数据,训练深度神经网络模型,得到深度声纹哈希函数。之后通过深度声纹哈希函数计算训练集对应的哈希编码,构建数据库;对于新录入的语音数据,使用深度声纹哈希函数计算对应的哈希编码,实时增加到数据库。在检索过程中,对于给定的语音,使用深度声纹哈希函数计算对应的哈希编码,最后在数据库中基于索引或海明距离排序得到检索结果。
  • 数据统计方法及相关设备-202310515920.6
  • 王曌;赵蕊;高怡 - 腾讯音乐娱乐科技(深圳)有限公司
  • 2023-05-09 - 2023-08-01 - G06F16/61
  • 本申请公开了数据统计方法及相关设备,该方法包括:将汇总后的用户历史时段内对各音频的操作行为数据,按预设格式存储于列式数据库,操作行为数据包含播放、收藏和分享中至少一种行为对应的时间类数据、次数类数据;根据列式数据库中的时间类数据/或次数类数据,计算用户在历史时段内的音频偏好特征。本申请将操作行为数据按预设格式存储于列式数据库,有助于低成本地存储更多行列的数据,提高数据的读写速度和转换效率,从而大幅度地降低成本投入。列式数据库中分布式存储的数据,可覆盖音频操作的多维度指标,满足想要从不同角度寻找用户情感共鸣点的产品需求,有助于有效了解和拓展用户的音频播放偏好。
  • 一种基于seq2seq网络的歌词对齐方法及系统-202010059082.2
  • 尹学渊;刘鑫忠;江天宇 - 成都潜在人工智能科技有限公司
  • 2020-01-19 - 2023-07-25 - G06F16/61
  • 本发明公开了一种基于seq2seq网络的歌词对齐方法及系统,方法包括:对歌词进行处理得到歌词向量,对音频进行处理得到起止时间与歌词对应的人声频谱图;采用seq2seq网络模型对歌词向量和对应的频谱图进行处理,得到输入歌词的注意力矩阵;将注意力矩阵整合解析为字符级别的对齐结果,得到歌词每个字的开始时间和结束时间。系统包括数据处理模块对歌词进行处理得到歌词向量,对音频进行处理得到起止时间与歌词对应的人声频谱图;数据预测模块采用网络模型对歌词向量和对应的频谱图进行处理,得到输入歌词的注意力矩阵;对齐结果解析模块用于将注意力矩阵整合解析为字符级别的对齐结果,得到歌词每个字的开始时间和结束时间。
  • 一种音频数据筛选方法和系统-202310425132.8
  • 李浩浩;王静宇;马亚中;李建华;李蹊;张聪聪;王辉;谢启繁 - 中关村科学城城市大脑股份有限公司
  • 2023-04-20 - 2023-07-04 - G06F16/61
  • 本发明涉及音频处理技术领域,具体公开了一种音频数据筛选方法和系统。本发明通过获取多个音频特征数据,构建音频特征库;接收会议参与信息,标记指令音频特征和多个与会音频特征;实时接收会议音频数据,按照指令音频特征,识别指令信息;按照指令信息,标记目标音频特征,从会议音频数据中筛选识别目标信息;将多个指令信息和多个目标信息进行整理记录,得到与会记录信息。能够构建音频特征库,标记与会议相关的指令音频特征和多个与会音频特征,在会议过程中,识别指令信息,进而筛选识别目标信息,进行信息整理记录,得到与会记录信息,从而能够在嘈杂的会议音频环境中准确识别出会议内容,且能够筛选获取重要的会议音频进行识别与记录。
  • 将实时客户标签应用于智能语音系统的方法及设备-202310062443.2
  • 王慧;孔娜;朱青;宋灿;范程宇;徐倩;邓阳博;史金凤 - 国家电网有限公司客户服务中心
  • 2023-01-19 - 2023-06-23 - G06F16/61
  • 本发明公开了一种将实时客户标签应用于智能语音系统的方法及设备,所述将实时客户标签应用于智能语音系统的方法,包括根据数据支撑层进行数据汇聚、计算,形成客户标签;通过基础支撑层对客户标签进行调试;通过应用集成接口调取调试后的客户标签,实现对客服中心业务系统的支撑。本发明提供的将实时客户标签应用于智能语音系统的方法,在将实时标签引入智能客服服务过程中,在保证服务稳定性的同时,进行差异化服务,不仅可提升客户服务满意度,还可利用智能服务所具有的反应迅速、不容易受话务量影响等特点,有效解决人工服务资源不够的问题,实现为客服专员减负。
  • 汽车异响诊断方法-202111431213.6
  • 赵文杰;刘涛;姜耀全;尉爽;张义波 - 上海汽车集团股份有限公司
  • 2021-11-29 - 2023-06-06 - G06F16/61
  • 本发明提供一种汽车异响诊断方法,包括步骤:S1:建立异响特征数据库;S2:获取车辆的诊断相关数据,诊断相关数据包括当前车况信息以及当前异响信息;根据当前异响信息确定当前车况信息所对应的当前异响特征;S3:将当前车况信息、当前车况信息对应的当前异响特征与异响特征数据库的多种车况信息、与各车况对应的异响特征进行比对;其中,当在异响特征数据库获得与当前车况信息、当前车况信息对应的当前异响特征匹配的车况信息、异响特征,根据车况信息、异响特征确定当前车辆问题。由此,能够快速的提供解决车辆问题的方案,大大缩短了售后维修时间,节省了时间成本,让用户拥有良好的售后体验感。
  • 音频分配方法、装置及存储介质-201910826025.X
  • 彭捷;杨益 - 平安科技(深圳)有限公司
  • 2019-09-02 - 2023-05-30 - G06F16/61
  • 本申请实施例公开了一种音频分配方法、装置及存储介质,其中方法包括:获取待标注音频的第一用户信息和音频属性以及多个标注方中每一标注方的第二用户信息和处理属性;根据所述第一用户信息和每一所述第二用户信息从所述音频属性对应的预设评分列表中确定每一所述标注方的安全值;根据每一所述标注方的安全值从所述多个标注方中选取安全值大于第一阈值的标注方以得到多个待分配标注方;根据所述音频属性和每一所述待分配标注方的处理属性从所述多个待分配标注方中选取目标标注方;将所述待标注音频对应的标注任务分配给所述目标标注方。采用本申请,可提高分配音频标注任务的准确性和安全性。
  • 音频处理方法、音频处理装置及可读存储介质-202110093642.0
  • 王世昌;成凯;武剑 - 北京雷石天地电子技术有限公司
  • 2021-01-22 - 2023-05-26 - G06F16/61
  • 本发明适用于音频处理,提供了音频处理方法,包括:对音频写入接口模块的第一应用库进行修改处理,得到初始应用库;基于初始应用库进行与硬件抽象层模块建立回路的封装,得到封装应用库;在封装应用库中进行包括音频环路和混音处理的音频处理,得到第二应用库并保存至音频写入接口模块中;获取音频信号,判断音频信号中是否包括第一音频数据和第二音频数据;若均包括,则接通音频通路,进入第一工作状态;若音频信号中仅包含第一音频数据,则接通原始通路,进入第二工作状态。本发明实施例无需进行开发,无需主动调用任何函数,只需要集成若干应用库即可打通音频环路实现边录边播且能够实现极低的音频延迟,极大地降低了开发难度、开发周期。
  • 生成运动视频配乐的方法和装置-202011552969.1
  • 胡晨鹏 - 上海掌门科技有限公司
  • 2020-12-24 - 2023-05-26 - G06F16/61
  • 本申请公开了生成运动视频配乐的方法和装置,涉及视频处理和云计算技术领域。具体实施方式包括:获取运动视频对应的动作节奏节点序列;在音频集合对应的一个或多个音频节奏节点序列中,搜索与所述动作节奏节点序列相匹配的至少一个音频节奏节点序列,其中,所述音频集合中包括一个或多个音频单元;在表征音频单元与音频节奏节点序列之间的对应关系的索引中,查找所述至少一个音频节奏节点序列所对应的音频单元,作为所述运动视频的配乐音频单元。本申请通过动作的节奏节点和音频的节奏节点,对运动视频进行智能化、自动化的配乐,并且可以有效地提高配乐的准确度。
  • 一种基于模块化的加权融合神经网络的音乐情感识别方法-202110398229.5
  • 朱永华;张美贤;朱蕴文 - 上海大学
  • 2021-04-14 - 2023-05-23 - G06F16/61
  • 本发明属于音乐内容分析领域,提出一种基于模块化的加权融合神经网络的音乐情感识别方法,利用改进的多通道结构实现更具全局性的频谱图细节处理,利用上下文信息加权实现深度时序关系处理,提升音乐情感数值预测的识别精度和稳定性。根据相关文献中情感描述规则,完成数据库音乐片段长度和数值的规范化;切分原始音频并提取对应频谱图,采用数据增强技术实现融合规则数据库的构建;通过调整深度神经网络感受野实现更具全局性的信息处理,提取显著性特征;利用长短时记忆模块处理时序信息,采用注意力机制提取深度关系;采用具有双重特性的损失函数,利用反向传播完成模型的优化和训练;最后,利用训练好的模型进行音乐情感数值预测。
  • 一种科技成果转化挖掘智能记录装置-202310144395.1
  • 唐清华 - 衡阳远赢科技有限公司
  • 2023-02-21 - 2023-05-19 - G06F16/61
  • 本发明公开了一种科技成果转化挖掘智能记录装置,涉及记录装置技术领域,针对现有的信息挖掘记录大多是通过与企业进行沟通人工手动记录,不仅增加了工作人员的工作量,还可能存在遗漏的情况,不便对主要的技术特点进行提取,记录效率较低,使用效果不够理想的问题,现提出如下方案,包括壳体,所述壳体的两侧均开设有多个散热孔,所述壳体的顶部开设有矩形孔与多个调节孔,所述壳体内固定安装有显示屏与控制面板,所述显示屏与所述矩形孔相适配。本发明通过与企业进行沟通设备自动智能记录,降低了工作人员的工作量,不会造成遗漏的情况,便于对主要的技术特点进行提取,记录效率较好,使用效果好,值得推广使用。
  • 数据存储方法、装置、电子设备和存储介质-202211700827.4
  • 刘宝;尤硕愚;张运坤 - 安徽淘云科技股份有限公司
  • 2022-12-28 - 2023-04-07 - G06F16/61
  • 本发明提供一种数据存储方法、装置、电子设备和存储介质,其中方法包括:确定待存储的对话语音,以及所述对话语音对应的对话文本;对所述对话文本中的用户语句进行要素拆解,得到所述用户语句的各语句要素,以及所述各语句要素之间的要素关系;基于所述各语句要素之间的要素关系,对所述用户语句的各语句要素进行重组,得到所述用户语句的存储信息,分别存储所述存储信息和所述对话语音,克服了传统方案中存储的数据繁多,查询十分不便的缺陷,待存储的对话语音的确定,以及针对于用户语句的要素拆解和重组能够在极大程度上缩减存储的数据量,同时还实现了数据的规整化,保证了数据存储的精简性和有序性,提升了查询便利性。
  • 单机语音存储方法、装置、设备及可读存储介质-201911247024.6
  • 彭辉;黎智勇;许敏强 - 广州国音智能科技有限公司
  • 2019-12-06 - 2023-01-20 - G06F16/61
  • 本申请公开了一种单机语音存储方法、装置、设备和可读存储介质,该方法包括采集语音信息,判断是否满足上传条件;若不满足上传条件,则获取语音信息的维度信息;将语音信息存储到维度信息在采集终端存储分区中所指向的目标存储分区,并为目标存储分区添加语音信息的索引标记;当检测到语音信息满足预设上传条件时,基于索引标记确定所述目标存储分区,将目标存储分区中语音信息和对应的维度信息上传。采集到语音信息后,判断是否满足上传条件,不满足上传条件,按照维度信息,找到采集终端中的目标存储分区,将语音信息存储并建立索引标记,若之后满足上传条件,根据索引标记,快速确定目标存储分区并上传语音信息和维度信息。
  • 音频数据的存储方法及其相关设备-202110739730.3
  • 朱逸程 - 华为技术有限公司
  • 2021-06-30 - 2022-12-30 - G06F16/61
  • 本申请提供了一种音频数据的存储方法和相关设备,通过将背景音频文件和用户录制的录音音频文件分开存储,利用背景音频录音音频文件和录音音频文件中的第一标识将背景音频文件和用户录制的录音音频文件关联,录音音频文件对应的音频的播放时长小于背景音频文件对应的音频的播放时长,录音音频仅仅包括背景音频中用户实际发声的时间段,录音音频和背景音频中相同的部分(背景音频中除过用户实际发声的时间段之外的音频数据)只需要在背景音频中存储一次即可,减少了录音音频文件的大小,避免了对于录音音频及背景音频之间相同的部分(即用户不发声的部分)的重复存储,降低存储资源浪费。
  • 面向海量音乐检索的非对称深度哈希方法、网络和网络的训练方法-202210994625.9
  • 姜莱 - 广东技术师范大学
  • 2022-08-18 - 2022-12-06 - G06F16/61
  • 面向海量音乐检索的非对称深度哈希方法、网络和网络的训练方法,属于多媒体信息技术和机器学习的交叉领域,为了解决海量音乐检索问题,获取待检索音乐数据的二进制表示及音乐数据库中各音乐数据的二进制表示,所述音乐数据库中同一类别的音乐数据的二进制表示趋于所述音乐类别的量化中心分布,所述量化中心是音乐数据库中音乐类别的二进制表示;计算所述待检索音乐数据的二进制表示与所述音乐数据库中各音乐数据的二进制表示之间的汉明距离;根据所述汉明距离,将与所述待检索音乐数据二进制表示的汉明距离最近的音乐库中的音乐数据的类别标签作为待检索音乐的类别标签,效果是能在小规模训练数据集下提高深度哈希二进制表示能力。
  • 音频信息处理方法、音频信息呈现方法及装置-202110513496.2
  • 杨宗 - 腾讯科技(深圳)有限公司
  • 2021-05-11 - 2022-11-11 - G06F16/61
  • 本发明提供了一种音频信息处理方法、音频信息呈现方法、装置、电子设备以及存储介质,方法包括:响应于动态修改指令,对第一音频轨道数据进行动态修改,得到第二音频轨道数据;响应于音频业务输出指令,从音频信息存储哈希表中获取音频信息,为音频信息配置对相应的音频帧数据读取器;通过音频帧数据读取器,提取音频信息中所存储的与目标时间戳相对应的第二音频轨道数据中的第一音频帧;对不同目标时间戳相对应的第一音频帧进行组合处理,得到并输出第二音频帧,以实现通过第二音频帧对音频业务输出指令进行响应,能够实现对音频信息进行实时修改与灵活控制,使得响应于音频业务输出指令的音频信息处理过程更加简便,提升音频信息处理的便捷性。
  • 一种教学多媒体设备用语音识别系统-202210597302.6
  • 吕书超 - 吕书超
  • 2022-05-30 - 2022-11-01 - G06F16/61
  • 本发明提供一种教学多媒体设备用语音识别系统,语音输入单元、用户语音存储单元、声音特点分析比较器、语音信息检索、操作指令生成模块、软硬件接口控制器、语音信息分类加工、数据库调用、执行模块;通过语音识别系统教师可以在高效检索宝贵课堂时间教学使用的所有教学知识,同时用户语音存储单元指定授权使用保证教学多媒体具有较高的安全性,也提高了教学的质量和效率,隔音气囊使得教师语音录入环节降低了外界噪音的干扰,提高了语音识别的准确度和反应速度,实现不同隔音等级的隔音效果,同时万向节可以方便教师语音录入的角度调节,提高了语音录入的实用性和更加的人性化。
  • 一种音频搜索方法、装置、电子设备及存储介质-202210723192.3
  • 战旭宁 - 青岛海信移动通信技术股份有限公司
  • 2022-06-23 - 2022-10-14 - G06F16/61
  • 本申请公开一种音频搜索方法、装置、电子设备及存储介质,属于音频处理技术领域,该方法包括:电子设备获取搜索词,搜索词用于搜索音频名和/或音频表演者;基于预先构建的目录树,从存储的整轨无损音频中查找与搜索词匹配的单轨无损音频的播放时间信息;输出单轨无损音频的播放时间信息。其中,目录树中保存有整轨无损音频中各单轨无损音频的音频描述信息,音频描述信息包括音频名、音频表演者和播放时间信息。这样,用户可以根据音频名和/或音频表演者在整轨无损音频中搜索任意单轨无损音频,提高整轨无损音频的播放便捷性,提升用户体验。
  • 一种基于倒频谱分析的快速音频检索方法-202011145738.9
  • 邵玉斌;杨贵安;龙华;杜庆治;刘晶;唐维康;陈亮 - 昆明理工大学
  • 2020-10-23 - 2022-09-13 - G06F16/61
  • 本发明公开了一种基于倒频谱分析的快速音频检索方法,属于音频检索技术领域。本发明包括:第一步,构建检索音频特征库,根据信号能量比值循环对检索音频库每一段音频提取频域特征构建出检索音频特征库,以供检索使用;第二步,提取样本音频指纹,根据信号能量比值对用户输入的样本音频提取频域特征形成样本音频特征;第三步,根据样本长度确定最佳混合点,样本音频特征与检索音频特征在最佳混合点混合使得对混合特征的倒频谱分析结果更为精确;第四步,样本音频检索,用倒频谱分析的方法寻找检索音频特征库中与样本音频特征相似度最高的检索音频特征,对应检索音频信息即为样本音频检索结果。本方法提取的音频特征代表性强且占用空间小;在检索时,倒频谱分析直接针对两个音频特征的混合结果进行,且倒谱分析仅对混合特征做傅里叶相关变换,计算量小且计算速度快。因此,针对现有技术在音频检索应用中检索效率低的缺点,本发明在保证音频检索准确率的前提下极大提高了检索效率。
  • 录音处理方法、装置、设备、系统及音频设备-201910550414.4
  • 张向军 - 歌尔股份有限公司
  • 2019-06-24 - 2022-09-06 - G06F16/61
  • 本发明公开了一种录音处理方法、装置、设备、系统及音频设备。该方法通过音频设备实施,包括:响应于用户发出的录音指令,录取用户发出的语音内容,生成对应的录音文件,并将录音文件保存在指定存储区域;响应于用户发出的录音提取指令,从指定存储区域中,提取与录音提取指令对应的录音文件,向用户播放。
  • 声纹检索方法、装置、设备及存储介质-202210703042.6
  • 周定军;彭俊清;王健宗 - 平安科技(深圳)有限公司
  • 2022-06-21 - 2022-08-19 - G06F16/61
  • 本申请实施例提供了一种声纹检索方法、装置、设备及存储介质,属于数据处理技术领域。该方法包括:获取语音集合的声纹特征以及用户的查询请求;基于预设定时索引模型生成与声纹特征对应的索引列表;对索引列表进行检索,得到查询特征,并对查询特征进行整合,得到查询集合;对语音集合进行实时查找,得到增量特征;将增量特征添加至查询集合,得到目标集合;将目标集合输入预设打分模型,对目标集合中的增量特征和查询特征进行打分,得到打分集合;根据查询请求从打分集合中确定与查询请求对应的目标声纹,本申请实施例能够实时地将新增的声纹特征建立到索引中,实现对声纹特征的准确查找。
  • 检索方法、装置、电子设备、存储介质和程序产品-202210429358.0
  • 邓晨 - 中国工商银行股份有限公司
  • 2022-04-22 - 2022-08-05 - G06F16/61
  • 本公开提供了一种检索方法,涉及检索技术领域,可以应用于金融领域或其他领域。该检索方法包括:获取至少一个目标词,以得到目标词集合;根据目标词集合,确定预设的检索词字典中每个检索词的第一检索系数;根据检索词字典和确定出的第一检索系数,构建检索词矩阵;获取关键词矩阵,关键词矩阵包括至少一个音频文件的第一关键词集合;根据检索词矩阵和关键词矩阵,构建目标矩阵,目标矩阵包括至少一个第一关键词集合,以及根据检索词矩阵生成的该第一关键词集合的检索得分;根据目标矩阵,生成检索结果。本公开还提供了一种检索装置、电子设备、存储介质和程序产品。
  • 歌曲索引方法及其装置、设备、介质、产品-202111494040.2
  • 肖纯智;张超钢 - 广州酷狗计算机科技有限公司
  • 2021-12-08 - 2022-08-02 - G06F16/61
  • 本申请公开一种歌曲索引方法及其装置、设备、介质、产品,所述方法包括:对歌曲音频数据中的音频信息进行编码,获得相应的编码信息;将所述编码信息输入已训练至收敛状态的特征提取模型的共用网络,经该共用网络中的多个卷积块依次对所述编码信息进行多级特征提取,获得中间特征信息;将所述中间特征信息输入所述特征提取模型的两个以上的分支网络,经每个分支网络中的多个卷积块对所述中间特征信息进行特征提取后,转换为相应的输出特征向量,各分支网络的输出特征向量所包含的深层语义信息各不相同;将所述输出特征向量作为表征所述歌曲音频数据的深层语义信息的高维索引向量。本申请提升了歌曲音频数据的深层语义信息的表示学习能力。
  • 歌曲匹配方法及其装置、设备、介质、产品-202111493983.3
  • 张超钢;肖纯智 - 广州酷狗计算机科技有限公司
  • 2021-12-08 - 2022-08-02 - G06F16/61
  • 本申请公开一种歌曲匹配方法及其装置、设备、介质、产品,所述方法包括:获取客户端提交的待匹配清唱旋律的音频数据相对应的编码信息;采用已训练至收敛状态的特征提取模型根据所述编码信息提取出表征该待匹配清唱旋律的多个尺度的深层语义信息的高维索引向量;计算所述高维索引向量与有旋律特征库中由所述特征提取模型提取的表征各个旋律片段的多尺度深层语义信息的高维索引向量之间的相似度,筛选出相似度满足预设条件的目标旋律片段;将曲库中包含所述目标旋律片段的目标歌曲推送至客户端设备。通过以上过程,可以快速高效精准地实现以歌搜歌服务,为用户查找到与待匹配清唱旋律相似的目标歌曲。
  • 歌曲比对方法及其装置、设备、介质、产品-202111491601.3
  • 肖纯智;张超钢 - 广州酷狗计算机科技有限公司
  • 2021-12-08 - 2022-07-29 - G06F16/61
  • 本申请公开一种歌曲比对方法及其装置、设备、介质、产品,所述方法包括:分别获取原版歌曲及被比歌曲的音频数据;采用已训练至收敛状态的特征提取模型提取原版歌曲的音频数据的多尺度深层语义信息,对应获得原版高维向量;采用所述特征提取模型提取被比歌曲的音频数据的多尺度深层语义信息,对应获得被比高维向量;计算所述原版高维向量与被比高维向量的相似度,判断相应的相似度数值是否大于第一预设阈值,当大于第一预设阈值时判定被比歌曲与原版歌曲构成翻唱关系。本申请能实现原版歌曲与被比歌曲之间的翻唱关系进行识别,可适用于歌曲侵权判定、翻唱识别之类的应用场景。
专利分类
×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

400-8765-105周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top