专利名称
主分类
A 农业
B 作业;运输
C 化学;冶金
D 纺织;造纸
E 固定建筑物
F 机械工程、照明、加热
G 物理
H 电学
专利下载VIP
公布日期
2023-10-24 公布专利
2023-10-20 公布专利
2023-10-17 公布专利
2023-10-13 公布专利
2023-10-10 公布专利
2023-10-03 公布专利
2023-09-29 公布专利
2023-09-26 公布专利
2023-09-22 公布专利
2023-09-19 公布专利
更多 »
专利权人
国家电网公司
华为技术有限公司
浙江大学
中兴通讯股份有限公司
三星电子株式会社
中国石油化工股份有限公司
清华大学
鸿海精密工业股份有限公司
松下电器产业株式会社
上海交通大学
更多 »
钻瓜专利网为您找到相关结果1805个,建议您升级VIP下载更多相关专利
  • [发明专利]改进的预训练方法、电子设备和存储介质-CN202310706125.5在审
  • 俞凯;马子阳;郑之胜;杨冠柔;陈谐 - 思必驰科技股份有限公司
  • 2023-06-14 - 2023-09-15 - G10L15/06
  • 本发明公开改进的预训练方法、电子设备和存储介质,其中,预训练方法,用于预训练模型,所述预训练模型包括单元生成模块和主干网络,包括:利用所述主干网络对语音进行降采样得到第一语音表征,使用掩码对所述第一语音表征中的部分语音表征进行遮蔽得到第二语音表征,对所述第二语音表征进行聚合得到输出语音表征;对于所述输出语音表征的被遮蔽部分,与所述单元生成模块提取的离散目标计算损失,并在所述主干网络中进行梯度反向传播。本申请实施例提出了一个通过无监督算法提升自监督语音表征学习的框架,优化自监督学习的训练目标,在ASR任务上效果超过最先进的模型,同时在多项非ASR任务上取得好的效果。
  • 改进训练方法电子设备存储介质
  • [发明专利]一种多人说话场景下音视频识别模型训练及识别方法-CN202310645108.5在审
  • 赵晴 - 镁佳(北京)科技有限公司
  • 2023-06-01 - 2023-09-15 - G10L15/06
  • 本发明提供了一种多人说话场景下音视频识别模型训练及识别方法,模型训练方法包括:获取多人说话场景下对应的多个视频数据和单个音频数据,对其进行混合得到训练数据;将训练数据输入预设模型中,得到多个视频数据对应的预测矩阵和CTC损失函数;使用主成分分析方法提取预测矩阵的特征矩阵,根据特征矩阵计算得到KL散度损失函数;根据CTC损失函数和KL散度损失函数计算预设模型的损失函数;利用训练数据循环迭代训练预设模型,直至预测模型的损失函数收敛,得到最优模型。本发明提供的多人说话场景下音视频识别模型训练及识别方法,利用多个视频数据与音频数据混合的方式训练模型,极大提升了多人说话场景下,对唤醒人的语音识别效果。
  • 一种说话场景视频识别模型训练方法
  • [发明专利]领域自适应框架的训练方法、系统、电子设备和存储介质-CN202310661624.7在审
  • 谭天;邵航;钱彦旻 - 思必驰科技股份有限公司
  • 2023-06-06 - 2023-09-15 - G10L15/06
  • 本发明实施例提供一种领域自适应框架的训练方法、系统、电子设备和存储介质。该方法包括:利用领域自适应框架的编码器确定训练语音的隐层特征;将隐层特征输入至领域自适应框架的解码器;固定判别器,基于迁移器确定出隐层特征在固定判别器预测的第一领域下的第一预测识别解码结果,基于训练语音的基准识别解码结果以及第一预测识别解码结果对迁移器进行训练;基于训练后的迁移器确定出隐层特征在判别器预测的第二领域下的第二预测识别解码结果,基于训练语音的基准识别解码结果以及第二预测识别解码结果对判别器进行训练。本发明实施例将判别器和迁移器分别训练优化,使优化后的判别器和优化器联合起来达到更好的性能。
  • 领域自适应框架训练方法系统电子设备存储介质
  • [发明专利]语音识别方法、语音识别模型的训练方法、装置及设备-CN202310591618.9在审
  • 易澄 - 北京达佳互联信息技术有限公司
  • 2023-05-23 - 2023-09-12 - G10L15/06
  • 本公开关于一种语音识别方法、语音识别模型的训练方法、装置及设备,该方法包括:获取样本音频以及样本音频中的第一样本音频对应的标注文本;基于第一样本音频和标注文本,对初始语音识别模型进行联合预训练,得到第一语音识别模型;基于样本音频对第一语音识别模型进行参数调整训练,得到训练好的语音识别模型。本公开实施例仅用部分样本音频对应的标注文本作为模型中间层的监督信号进行监督预训练,并同时对语音识别模型进行自监督预训练,此种联合预训练帮助模型同时学习到不同维度的发音特征,使得模型在正式训练中更快更好地学习音频特征,提升了语音识别模型的训练效率,并且提升了语音识别模型在应用侧语音识别的准确性。
  • 语音识别方法模型训练装置设备
  • [发明专利]数据选取方法、装置、电子设备及存储介质-CN202310521052.2在审
  • 黎荣晋;张伟彬;陈东鹏;李亚桐 - 深圳市声扬科技有限公司
  • 2023-05-10 - 2023-09-12 - G10L15/06
  • 本申请提供一种数据选取方法、装置、电子设备及存储介质,该数据选取方法包括:获取训练文件和训练文件对应的收敛值,基于收敛值构建多个训练样本集,基于测试集对分别经过各训练样本集训练后的模型进行测试,获得各训练样本集对应的错误率;基于各训练样本集对应的错误率选取目标训练样本集,并基于选取的目标训练样本集从N个训练文件中选取目标训练文件,以利用选取的目标训练文件进行模型训练得到训练后的数据处理模型;本方法通过综合考虑收敛值和错误率对目标训练文件的选取,实现了利用测试集的识别结果来指导目标训练文件的选取,使得利用选取的目标训练文件训练后的模型在识别阶段的识别准确度和识别效率提高。
  • 数据选取方法装置电子设备存储介质
  • [发明专利]语音处理方法及电子设备-CN202310561019.2在审
  • 董倩倩;许晨;王明轩;高汝霆 - 北京有竹居网络技术有限公司
  • 2023-05-17 - 2023-09-08 - G10L15/06
  • 本公开涉及语音处理方法、装置、电子设备、计算机可读存储介质和计算机程序产品。该方法包括:获取经训练的语音翻译模型,其中经训练的语音翻译模型包括声学编码器和文本编码器,其中声学编码器和/或文本编码器包括在相邻的第一层与第二层之间的中间CTC模块,中间CTC模块用于基于第一层的输出以及词嵌入矩阵来确定第二层的输入;以及将待处理的源语言语音输入到经训练的语音翻译模型,得到对应的目标语言文本。以此方式,该语音翻译模型通过在声学编码器和/或文本编码器中引入两个相邻层之间的中间CTC模块,将预测感知编码整合到编码信息中,能够解决CTC固有的独立假设问题,因此,能够提升语音翻译的处理的性能。
  • 语音处理方法电子设备
  • [发明专利]一种关键词识别方法及系统-CN202310526019.9在审
  • 张明;杜文强 - 常州分音塔科技有限公司
  • 2023-05-11 - 2023-09-08 - G10L15/06
  • 本发明提供了一种关键词识别方法及系统,方法包括分别构建基于self‑attention机制的语音识别模型、关键词编码模型及说话人信息编码模型;基于一般音频数据计算语音识别模型的第一损失函数值;以及,基于关键词文本数据及说话人音频数据计算关键词编码模型及说话人信息编码模型的第二损失函数值;利用第一损失函数值训练语音识别模型;以及,利用第二损失函数值联合训练语音识别模型、关键词编码模型及说话人信息编码模型;直至模型收敛,得到训练好的联合识别模型;利用联合识别模型进行关键词识别,得到基于特定说话人的关键词识别结果。通过本发明,可以有效的抓取语音流中特定说话人呼叫的关键词,大大降低误唤醒率,且关键词的数量不受限制。
  • 一种关键词识别方法系统

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

400-8765-105周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top