专利名称
主分类
A 农业
B 作业;运输
C 化学;冶金
D 纺织;造纸
E 固定建筑物
F 机械工程、照明、加热
G 物理
H 电学
专利下载VIP
公布日期
2023-10-24 公布专利
2023-10-20 公布专利
2023-10-17 公布专利
2023-10-13 公布专利
2023-10-10 公布专利
2023-10-03 公布专利
2023-09-29 公布专利
2023-09-26 公布专利
2023-09-22 公布专利
2023-09-19 公布专利
更多 »
专利权人
国家电网公司
华为技术有限公司
浙江大学
中兴通讯股份有限公司
三星电子株式会社
中国石油化工股份有限公司
清华大学
鸿海精密工业股份有限公司
松下电器产业株式会社
上海交通大学
更多 »
钻瓜专利网为您找到相关结果1805个,建议您升级VIP下载更多相关专利
  • [发明专利]语音交互的自适应优化方法及装置-CN202310969845.0在审
  • 吴正飞;叶德英;阴山慧;孙亚红;吴倩倩 - 奇瑞汽车股份有限公司
  • 2023-08-01 - 2023-10-27 - G10L15/06
  • 本发明涉及智能座舱技术领域,提供了一种语音交互的自适应优化方法,包括如下步骤:(1)激活语音控制功能,接收驾驶员录入的语音数据;(2)将语音数据转换成文本数据,提取文本数据中动词及名词,将动词及名字组成控制指令;(3)检测当前形成的控制指令是否有效,若检测结果为是,则将有效控制指令发送至对应的控制器,以控制对应对象执行指令对应的动作。通过针对每个驾驶员构建用于口音纠正的语音库,基于该语音库来辅助文本数据的转换,以降低口音导致的控制指令识别偏差,可以极大地提高控制指令识别的精准度。
  • 语音交互自适应优化方法装置
  • [发明专利]一种鲁棒的伪造语音算法的溯源方法及装置-CN202310746199.1在审
  • 王文超;陆镜泽;张鹏远;陈树丽 - 中国科学院声学研究所
  • 2023-06-21 - 2023-10-27 - G10L15/06
  • 本发明提供一种鲁棒的伪造语音算法的溯源方法及装置。该方法包括:利用训练数据集训练针对伪造语音算法的分类器;利用训练好的分类器处理所述训练数据集,得到所述分类器中的隐层针对所述各条伪造语音生成的隐层特征;利用训练好的分类器处理待检测的目标语音信号,得到所述分类器中的隐层生成的目标隐层特征和所述分类器的输出层输出的目标分类结果;分别计算所述目标隐层特征与若干隐层特征的距离,并确定其中的最短距离;当所述最短距离大于或等于预设阈值时,将所述目标分类结果作为所述目标语音信号的最终分类结果。如此,可以使用声码器生成伪造算法识别的训练集。引入最邻近节点算法,通过最邻近距离的分布区分训练集中不存在的分布外数据。
  • 一种伪造语音算法溯源方法装置
  • [发明专利]语音识别方法、语音识别系统、计算机设备及存储介质-CN202310716585.6在审
  • 张旭龙;王健宗;程宁;朱可欣 - 平安科技(深圳)有限公司
  • 2023-06-16 - 2023-10-27 - G10L15/06
  • 本申请实施例提供了一种语音识别方法、语音识别系统、计算机设备及存储介质,属于金融科技技术领域。该方法包括:将具有预设情感类别的目标语音输入至预训练的多任务语音识别模型;通过第一语音编码子模型对目标语音进行语音编码得到初始语音特征;通过第一注意力子模型对初始语音特征进行语音注意力处理得到第一目标注意力特征;通过第二语音编码子模型对初始语音特征进行隐藏特征编码得到隐藏语音特征;通过第二注意力子模型对第一目标注意力特征和隐藏语音特征进行隐藏注意力处理得到第二目标注意力特征;通过多任务分类子模型对第二目标注意力特征进行语音分类得到目标语音标签。本申请实施例能够提高多任务语音识别的识别准确率。
  • 语音识别方法系统计算机设备存储介质
  • [发明专利]语音处理模型的训练方法和数据增强方法、装置及设备-CN202111083473.9有效
  • 赵情恩 - 北京百度网讯科技有限公司
  • 2021-09-15 - 2023-10-27 - G10L15/06
  • 本公开提供了一种语音处理模型的训练方法和增强数据的方法、装置、设备和介质,涉及人工智能领域,具体涉及语音识别、语音合成和深度学习技术领域。语音处理模型的训练方法的具体实现方案为:基于第一语音数据的第一声学特征,确定音频样本的第一音素特征;基于第一语音数据的第一声学特征、第一语音识别特征和第一音素特征,采用语音处理模型的韵律编码网络得到第一语音数据的第一韵律特征;基于第一声学特征、第一语音识别特征和第一韵律特征,采用语音处理模型的解码网络得到预测声学特征;以及基于预测声学特征和第一声学特征之间的差异,对语音处理模型进行训练。
  • 语音处理模型训练方法数据增强装置设备
  • [发明专利]语音处理方法及装置、电子设备、计算机可读存储介质-CN202010630225.0有效
  • 林炳怀;王丽园 - 腾讯科技(深圳)有限公司
  • 2020-07-01 - 2023-10-27 - G10L15/06
  • 本申请的实施例揭示了一种语音处理方法及装置。该方法包括:获取针对语音进行识别处理得到的声学参数和识别文本;根据所述声学参数提取所述语音的声学特征,并根据所述识别文本提取所述语音的文本特征;根据所述语音关联的得分点类型,将所述声学特征和所述文本特征输入至与所述得分点类型相匹配的评分预测模型中,得到所述评分预测模型根据所述声学特征、所述文本特征以及所述得分点类型输出的针对所述语音的评分值,不同的得分点类型所匹配的评分预测模型是不同的。本申请实施例的技术方案能够避免出现由于语音关联的得分点类型与评分预测模型不匹配而引起的评分误差,提升语音评分的准确性。
  • 语音处理方法装置电子设备计算机可读存储介质
  • [发明专利]内容识别、模型训练、数据处理方法、系统及设备-CN201910008803.4有效
  • 李鹏;王炎 - 阿里巴巴集团控股有限公司
  • 2019-01-04 - 2023-10-24 - G10L15/06
  • 本申请实施例提供一种内容识别、模型训练、数据处理方法、系统及设备。其中,内容识别方法包括:将待识别内容作为应用模型的输入,执行所述应用模型输出第一结果信息;基于所述第一结果信息,确定作为识别结果的内容标签;根据所述内容标签,执行相应的业务操作;其中,所述应用模型是训练模型完成训练后得到的,所述训练模型在训练过程中采用至少两种损失函数计算一次迭代后的至少两个损失值,并基于所述至少两个损失值完成参数的更新。本申请实施例提供的技术方案,内容识别准确率高,尤其对相似性较高的内容,如音近字和同音字,具有较好的区分力。
  • 内容识别模型训练数据处理方法系统设备
  • [发明专利]音频分类模型的训练方法、音频分类方法、以及装置-CN202310891475.3在审
  • 江益靓;姜涛;赵伟峰 - 腾讯音乐娱乐科技(深圳)有限公司
  • 2023-07-19 - 2023-10-20 - G10L15/06
  • 本公开公开了一种音频分类模型的训练方法、音频分类方法、以及装置,属于计算机技术领域。所述方法包括:获取待训练的音频分类模型对应的类型标签层级关系;获取样本音频的音频数据和样本音频的基准分类结果;将样本音频的音频数据输入待训练的音频分类模型,得到预测分类结果;基于预测分类结果和基准分类结果之间的匹配情况,确定第一损失值;基于类型标签层级关系中存在关联关系的类型标签在预测分类结果中对应的匹配概率值,确定第二损失值;基于第一损失值和第二损失值,对待训练的音频分类模型进行训练,若满足预设训练结束条件则得到训练完成的音频分类模型。采用本公开,提高了训练完成的音频分类模型对各层级预测的准确性和一致性。
  • 音频分类模型训练方法以及装置
  • [发明专利]语音信号识别方法、装置、电子设备和计算机可读介质-CN202311154546.8在审
  • 孙福尧 - 鹿客科技(北京)股份有限公司
  • 2023-09-08 - 2023-10-20 - G10L15/06
  • 本公开的实施例公开了语音信号识别方法、装置、电子设备和计算机可读介质。该方法的一具体实施方式包括:采集用户的语音信号;对语音信号进行预处理,得到预处理后语音信号;对预处理后语音信号进行频域变换处理,以生成语音频谱图;根据语音频谱图,生成语音能量谱图;根据语音能量谱图,生成对数能量谱图;对对数能量谱图进行时域变换处理,得到特征参数序列;根据特征参数序列,确定差分特征参数序列;生成更新差分序列;根据更新差分序列,生成语音特征向量;对语音特征向量进行降维处理,以生成低维语音特征向量;将低维语音特征向量输入至语音信号识别模型中,得到语音信号识别结果。该实施方式可以提高语音信号识别的准确率。
  • 语音信号识别方法装置电子设备计算机可读介质
  • [发明专利]一种基于深度语音波形先验的对抗样本还原方法-CN202310846991.4在审
  • 陈阳;陈凯;汪哲贤 - 东南大学
  • 2023-07-11 - 2023-10-20 - G10L15/06
  • 本发明公开了一种即插即用的动态对抗样本防御方法——LowDDAWP‑Net,用于将对抗样本的转录恢复成良性转录。首先通过语音活动检测算法将对抗语音分割为静音片段和话语片段,然后通过静音片段提取对抗扰动的分布,通过重建分离使话语片段的对抗扰动被滤除,从而达到将对抗音频恢复为良性音频的目的,并且通过AMR压缩算法和基于语音不确定性的对数最小均方误差算法(Logmmse_SPU‑cohen)提取话语片段的结构信息,提高防御算法的拟合速度。通过本发明能够实现将有攻击性的对抗样本还原成良性样本,并且防御模块的参数动态更新,提高了语音识别系统的安全性能,为对抗样本的防御提供了一种有效的还原方法。
  • 一种基于深度语音波形先验对抗样本还原方法
  • [发明专利]语音识别模型的训练方法、装置、计算机设备及存储介质-CN202310251171.0在审
  • 谭风云;魏韬;马骏;王少军 - 平安科技(深圳)有限公司
  • 2023-03-09 - 2023-10-20 - G10L15/06
  • 本申请涉及人工智能,提供一种语音识别模型的训练方法。所述语音识别模型包含编码器和解码器,所述方法包括:提取训练样本语音数据的声学特征,得到待训练声学特征数据;将所述待训练声学特征数据输入至所述编码器的Conformer层进行计算处理,得到第一音频编码向量;将所述第一音频编码向量输入所述编码器的第一轻量级交换路由模块进行计算处理,得到第二音频编码向量;将所述第二音频编码向量输入所述解码器的Transformer层进行计算处理,得到第一文本编码向量;将所述第一文本编码向量输入所述解码器的第二轻量级交换路由模块进行计算处理,得到中英文语音识别结果;重复前述训练步骤,直至所有损失分别达到收敛,得到目标中英文语音识别模型。
  • 语音识别模型训练方法装置计算机设备存储介质

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

400-8765-105周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top