专利名称
主分类
A 农业
B 作业;运输
C 化学;冶金
D 纺织;造纸
E 固定建筑物
F 机械工程、照明、加热
G 物理
H 电学
专利下载VIP
公布日期
2023-10-24 公布专利
2023-10-20 公布专利
2023-10-17 公布专利
2023-10-13 公布专利
2023-10-10 公布专利
2023-10-03 公布专利
2023-09-29 公布专利
2023-09-26 公布专利
2023-09-22 公布专利
2023-09-19 公布专利
更多 »
专利权人
国家电网公司
华为技术有限公司
浙江大学
中兴通讯股份有限公司
三星电子株式会社
中国石油化工股份有限公司
清华大学
鸿海精密工业股份有限公司
松下电器产业株式会社
上海交通大学
更多 »
钻瓜专利网为您找到相关结果685个,建议您升级VIP下载更多相关专利
  • [发明专利]一种基于声纹识别的音频鉴伪方法-CN202310875841.6在审
  • 郑威;云剑;凌霞;郑晓玲;周凡棣;海涵;辛鑫;刘澎 - 中国信息通信研究院
  • 2023-07-17 - 2023-10-27 - G10L17/02
  • 本发明公开了一种基于声纹识别的音频鉴伪方法,涉及特殊音频鉴伪领域,S1,获取检测音频中的音频数据,所述音频数据包括时域特征数据、IP数据和检测音频元数据;S2,通过时域特征分析模型对时域特征数据进行第一数据分析,生成时域目标;S3,通过IP比对模型对获取的IP数据进行第二数据分析,生成IP标注;S4,通过元数据分析模型对获取的检测音频元数据进行第三数据分析,生成元数据标注;S5,通过标注匹配模型将生成IP标注和元数据标注进行匹配分析,得出网络识别目标;S6,对检测音频中的时域目标和网络识别目标进行整合分析,对该检测音频生成可信度标记,本发明通过音频信号、IP数据和音频元数据等条件提供更可靠和准确的音频鉴伪结果。
  • 一种基于声纹识别音频方法
  • [发明专利]一种基于多层次特征融合的短语音说话人识别方法-CN202310986807.6有效
  • 张葛祥;汤刚;杨强;何瑶 - 成都信息工程大学
  • 2023-08-08 - 2023-10-27 - G10L17/02
  • 本发明公开一种基于多层次特征融合的短语音说话人识别方法,涉及说话人识别技术领域,其方法包括:通过对包含目标短语音说话人的语音数据进行特征提取预处理,分别提取所述语音数据中的声学特征、韵律特征以及深层特征;通过对所述声学特征、所述韵律特征以及所述深层特征分别进行优化处理,得到优化后的声学特征、优化后的韵律特征以及优化后的深层特征;通过对所述优化后的声学特征、所述优化后的韵律特征以及所述优化后的深层特征进行融合处理,得到融合处理后的多通道特征;将所述融合处理后的多通道特征输入至训练好的深度神经网络模型中得到特征相似度值,并根据所述特征相似度值确定所述语音数据对应的目标短语音说话人。
  • 一种基于多层次特征融合语音说话识别方法
  • [发明专利]声纹识别方法和装置-CN202210374386.7在审
  • 王耀光;吴彪;夏日升 - 北京荣耀终端有限公司
  • 2022-04-11 - 2023-10-24 - G10L17/02
  • 本申请实施例提供一种声纹识别方法和装置,涉及终端技术领域,方法包括:终端设备采集第一语音,得到第一语音对应的第一声纹向量;当终端设备确定第一语音满足预设条件时,终端设备获取第一声纹向量与预设的第二声纹向量的相似度得分,得到第一数值;当第一数值小于或等于第一阈值时,终端设备获取第三声纹向量与预设的第四声纹向量的相似度得分,得到第二数值;当第二数值大于第二阈值时,终端设备执行第一语音对应的任务。这样,使得终端设备可以通过模拟用户佩戴口罩场景时获取的第三声纹向量与预设的佩戴口罩时用户的声纹向量的相似度,实现用户佩戴口罩场景中的语音的精准识别,增加声纹识别方法的准确性。
  • 声纹识别方法装置
  • [发明专利]一种声纹识别处理方法及系统-CN202310900334.3在审
  • 崔晓飞;石磊;刘岁成;于海波;尹学海;石科峰 - 河北华网计算机技术有限公司
  • 2023-07-21 - 2023-10-24 - G10L17/02
  • 本发明涉及一种声纹识别处理方法,包括:建立穿戴设备与云端系统的通信连接;语音解锁穿戴设备,穿戴设备采集用户的语音信息形成用户声纹信息并上传至云端系统,云端系统提取用户声纹信息中的声纹特征并与云端系统的声纹特征库中的全部声纹特征进行一一比对,若声纹特征库中存在用户声纹信息中的声纹特征,穿戴设备则解锁;若穿戴设备解锁,穿戴设备则采集当前环境中的环境语音形成环境语音信息并上传至云端系统,云端系统对环境语音信息进行分析并作出不同的指令。本发明通过在施工人员身上携带可穿戴设备,然后使穿戴设备与云端系统建立连接,然后利用云端系统对施工环境中的声音进行分辨,有效的提高了施工人员的安全性。
  • 一种声纹识别处理方法系统
  • [发明专利]一种基于特定人音频的表征构建方法-CN202310980913.3在审
  • 郑威;云剑;凌霞;郑晓玲;周凡棣;海涵;辛鑫;刘澎 - 中国信息通信研究院
  • 2023-08-04 - 2023-10-20 - G10L17/02
  • 本发明公开了一种基于特定人音频的表征构建方法,涉及音频分析技术领域,具体步骤包括:步骤S100、获取特定人音频数据中的人声数据与环境数据;步骤S200、构建人声分析模型,对人声数据进行分析并生成人声分析系数;步骤S300、对所述人声数据与环境数据进行组合分析,生成环境分析系数;步骤S400、将人声分析系数和环境分析系数进行整合处理,对所述特定人音频音频数据进行表征参数的生成;步骤S500、对表征参数进行阈值分析,通过分析结果对所述特定人音频进行表征标记,本发明考虑了环境对音频的影响,从而更加全面地分析音频的真伪;采用实时手段进行数据的获取和处理,可以对特定人音频进行实时的表征和鉴定,增加了鉴定的实时性和准确性。
  • 一种基于特定音频表征构建方法
  • [发明专利]一种音频导读自动生成方法和系统-CN202310676882.2有效
  • 张辰;张芳 - 北京奇趣万物科技有限公司
  • 2023-06-08 - 2023-10-20 - G10L17/02
  • 本申请提供一种音频导读自动生成方法和系统,方法包括:向第一用户展示和提示所述第一用户发声阅读第一阅读材料,获取第一用户的音频记录;解析所述第一用户的音频记录,提取所述音频记录的特征信息,以获取所述第一用户的发声规律,所述发声规律为文字、拼音、声调、声纹、语速、和音强的映射关系;将所述第一阅读材料的文本、所述音频记录的特征信息和发声规律输入并训练预设神经网络;获取第二阅读材料的文本,将所述第二阅读材料的文本输入训练后的神经网络中,输出具有相同发声规律的音频导读文件;向第二用户展示所述第二阅读材料,根据用户的操作指示打开相应文本材料页数或段落,并向所述第二用户播放相应的所述音频导读文件的相应页数或段落的音频。
  • 一种音频导读自动生成方法系统
  • [发明专利]跨信道声纹识别方法及装置-CN202010216418.1有效
  • 吕楠楠;宁博;巫昌凯;张松 - 中国工商银行股份有限公司
  • 2020-03-25 - 2023-10-13 - G10L17/02
  • 本发明公开了一种跨信道声纹识别方法及装置,其中,该方法包括:获取来自第一信道的包含作业指令的用户音频数据;将预处理后的用户音频数据输入至已训练的信道拟合器,以输出无差异音频数据;基于已训练的声纹识别模型,并根据预先存储的验证音频数据对无差异音频数据进行识别,以识别用户身份,其中,验证音频数据来自于第二信道,声纹识别模型由来自所述第二信道的历史音频数据进行训练;响应于所述用户身份识别成功,执行作业指令。通过本发明,可以可以提高跨信道声纹识别的准确率。
  • 信道声纹识别方法装置
  • [发明专利]一种基于全局注意力机制的DenseNet-LSTM-ED的声纹识别方法-CN202310826924.6在审
  • 王鲁昆 - 江苏五正信息科技有限公司
  • 2023-07-07 - 2023-10-10 - G10L17/02
  • 本发明公开了一种基于全局注意力机制的DenseNet‑LSTM‑ED的声纹识别方法,属于声纹识别技术领域,该方法首先对语音信号分割、加窗、傅里叶变换、能量密度谱、对数变换和彩色映射得到语音信号与之对应的语谱图;然后分别利用DenseNet模块、LSTM单元和ED模块分别对语谱图进行处理,将DenseNet模块、LSTM单元的处理结果融合形成时空融合信息,ED模块对语谱图进行处理形成增强信息;接着将时空融合信息与增强信息融合形成时空增强信息,并使用全局注意力机制对其赋予不同的权重,来增加关键帧语音对识别结果的贡献度,并通过Softmax损失函数与CenterLoss损失函数联合监督的方式来实现说话人识别的分类,本发明能够有效提高声纹识别的准确率。
  • 一种基于全局注意力机制densenetlstmed声纹识别方法
  • [发明专利]一种声纹注册方法、装置及设备-CN202310867638.4在审
  • 班荣军 - 安徽声云智能科技有限公司
  • 2023-07-15 - 2023-10-10 - G10L17/02
  • 本发明公开了声纹注册技术领域的一种声纹注册方法、装置及设备,包括:通过录音设备记录说话人的语音数据,采集的语音数据进行语音识别,获得语音识别结果,对语音数据存储;对获取的语音样本切分为长度相同的语音帧;将语音识别得到的语音识别结果与随机内容进行比对,保存比对结果一致的语音数据作为原始文件;获取每条语音段中每个语音帧的声纹识别特征,并于声纹注册的录音文件进行声纹注册,该声纹注册方法、装置及设备,结构设计合理,能够使注册的声纹质量提高,语言采集的数据更的精准,能够在用户声音出现变化的情况下,能够精准识别,避免因声音的变化导致声纹的录制失败,能够一次性完成声纹的录制,无需反复注册。
  • 一种声纹注册方法装置设备
  • [发明专利]基于自蒸馏预训练和元学习微调的远场说话人确认方法-CN202310689924.6在审
  • 李艳雄;黄启晟;曹文昌;李佳龙;谭嘉昕 - 华南理工大学
  • 2023-06-12 - 2023-10-10 - G10L17/02
  • 本发明公开了一种基于自蒸馏预训练和元学习微调的远场说话人确认方法,过程如下:从近场训练语音提取对数梅尔谱特征作为网络的输入,采用自蒸馏学习方法预训练深度神经网络;接着,将远场训练语音的对数梅尔谱特征作为网络的输入,采用元学习方法微调经过预训练的网络;然后,将注册语音的对数梅尔谱特征输入经过预训练和微调的网络得到变换特征矢量,将测试语音的对数梅尔谱特征输入经过微调和预训练的网络得到变换特征矢量;最后,计算测试语音变换特征矢量与注册语音变换特征矢量之间的距离,判断二者是否来自同一个说话人。本发明方法既提高了网络训练效率,又提升了网络在注册语音与测试语音的录制环境不一致时的说话人确认准确率。
  • 基于蒸馏训练学习微调说话确认方法
  • [发明专利]一种基于语音的异常检测方法、装置、设备及存储介质-CN202310791225.2在审
  • 韩朋朋 - 中国银行股份有限公司
  • 2023-06-30 - 2023-10-10 - G10L17/02
  • 本申请实施例提供了一种基于语音的异常检测方法、装置、设备及存储介质,可应用于金融领域或其他领域,该方法包括:对待处理语音进行特征提取,得到待处理声纹特征和待处理情感特征;将待处理声纹特征和待处理情感特征输入预先训练好的分析模型,得到声纹识别结果和情感分析结果;基于声纹识别结果和情感分析结果,生成待处理语音的异常检测结果。本申请实施例将声纹识别技术和情感分析技术相结合,通过声纹识别对用户身份进行认证,通过情感分析可以更好地理解用户的情感状态,提高了身份识别和欺诈检测能力,可以确保用户数据的安全性,提高异常检测的效率。
  • 一种基于语音异常检测方法装置设备存储介质
  • [发明专利]一种基于FFC-LSTM的多通道目标语音提取方法及电子设备-CN202310848550.8在审
  • 张海剑;陈佳佳;孙思雨 - 武汉大学
  • 2023-07-11 - 2023-10-10 - G10L17/02
  • 本发明公开了一种基于FFC‑LSTM的多通道目标语音提取方法及电子设备,包括声纹特征提取模块,短时傅里叶变换模块、编码器模块、解码器模块、目标说话人特征提取模块和短时傅里叶逆变换模块,其中声纹特征提取模块用于从参考语音中提取目标说话人声纹信息,短时傅里叶变换模块用于将混合语音转换为复数谱,编码器模块用于将混合复数谱编码为高维特征表示,目标说话人特征提取模块根据给定声纹特征信息从混合语音高维特征表示中提取出目标语音特征,解码器模块用于将目标语音特征映射为复数掩膜,将复数掩膜作用于混合语音复数谱得到目标语音复数谱,最后使用短时傅里叶逆变换模块将目标语音复数谱转化为目标语音时域信号。本发明具有较强的实用性。
  • 一种基于ffclstm通道目标语音提取方法电子设备

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

400-8765-105周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top