专利名称
主分类
A 农业
B 作业;运输
C 化学;冶金
D 纺织;造纸
E 固定建筑物
F 机械工程、照明、加热
G 物理
H 电学
专利下载VIP
公布日期
2023-10-24 公布专利
2023-10-20 公布专利
2023-10-17 公布专利
2023-10-13 公布专利
2023-10-10 公布专利
2023-10-03 公布专利
2023-09-29 公布专利
2023-09-26 公布专利
2023-09-22 公布专利
2023-09-19 公布专利
更多 »
专利权人
国家电网公司
华为技术有限公司
浙江大学
中兴通讯股份有限公司
三星电子株式会社
中国石油化工股份有限公司
清华大学
鸿海精密工业股份有限公司
松下电器产业株式会社
上海交通大学
更多 »
钻瓜专利网为您找到相关结果362750个,建议您升级VIP下载更多相关专利
  • [发明专利]一种语音合成模型的训练方法及一种语音合成方法-CN202010175459.0在审
  • 杨丽兵 - TCL科技集团股份有限公司
  • 2020-03-13 - 2021-09-28 - G10L13/02
  • 本申请适用于计算机技术领域,尤其涉及一种语音合成模型的训练方法及一种语音合成方法。所述语音合成模型的训练方法包括:对第一语音样本进行发音标注,获取第一语音样本的文本序列;将第一语音样本及第一语音样本的文本序列成对地输入至预设的语音合成模型中进行处理,得到与第一语音样本的文本序列对应的输出音频及所述第一语音样本的音频特征;根据第一语音样本的音频特征和输出音频,对语音合成模型的参数进行调整,直至满足预设的训练条件,以得到已训练的语音合成模型。本申请中,能够基于方言的样本语音进行发音标注,进而得到能够合成具备该方言发音特点的语音合成模型,提高方言语音合成的质量。
  • 一种语音合成模型训练方法
  • [发明专利]一种针对声纹鉴定任务的语音降噪方法及装置-CN202310492167.3有效
  • 张兆峰;邓菁 - 北京远鉴信息技术有限公司
  • 2023-05-05 - 2023-07-21 - G10L17/02
  • 本公开提供了一种针对声纹鉴定任务的语音降噪方法及装置,通过获取样本含噪语音样本语音;确定样本含噪语音的说话人对应的第一身份认证矢量,以及样本语音的说话人对应的第二身份认证矢量;针对样本含噪语音样本语音中的每一帧,确定该帧样本含噪语音对应的第一频域向量,以及该帧样本语音对应的第二频域向量;根据第一身份认证矢量、第二身份认证矢量、第一频域向量以及第二频域向量训练预设的语音降噪模型;获取待降噪语音,将待降噪语音输入至训练好的语音降噪模型中,确定待降噪语音对应的目标降噪语音。可以在减少噪音影响的同时,保留了语音的身份特征信息,从而有效提升声纹鉴定任务性能的效果。
  • 一种针对声纹鉴定任务语音方法装置
  • [发明专利]变声语音还原方法、装置、计算机设备和存储介质-CN202010719804.2在审
  • 张伟彬;黄河清 - 深圳市声扬科技有限公司
  • 2020-07-24 - 2020-10-02 - G10L21/013
  • 本申请涉及一种变声语音还原方法、装置、计算机设备和存储介质。所述方法包括:获取原始语音样本;通过目标程序对所述原始语音样本进行变声处理,得到变声语音样本;分别对所述原始语音样本和所述变声语音样本进行语音信号特征提取,获得所述原始语音样本的第一语音信号特征值集合和所述变声语音样本的第二语音信号特征值集合;根据第一语音信号特征值集合和第二语音信号特征值集合包含的对应的语音信号特征值间的映射关系,确定还原函数;基于所述还原函数,对通过所述目标程序变声得到的待还原变声语音进行变声还原。采用本方法能够降低变声语音还原的成本。
  • 变声语音还原方法装置计算机设备存储介质
  • [发明专利]一种语音识别模型的训练以及语音识别的方法和装置-CN202010639895.9有效
  • 康燕斌;张志齐 - 上海依图信息技术有限公司
  • 2020-07-06 - 2023-05-02 - G10L15/06
  • 本申请公开了一种语音识别模型的训练以及语音识别的方法和装置,属于人工智能技术领域,该方法包括,获取标注语音样本集合,以及无标注语音样本集合;根据标注语音样本集合,分别对每一预设的语音识别教师模型进行训练,获得训练好的语音识别教师模型;分别针对每一训练好的语音识别教师模型,将无标注语音样本集合中的各语音样本输入至语音识别教师模型中,输出相应的文本信息;根据标注语音样本集合、无标注语音样本集合以及相应的文本信息,对预设的语音识别学生模型进行训练,获得目标语音识别模型。获取待识别的语音数据;将语音数据输入至训练好的目标语音识别模型,输出语音识别结果。这样,提高了目标语音识别模型的性能。
  • 一种语音识别模型训练以及方法装置
  • [发明专利]一种语音样本混淆方法及装置-CN202211137162.0在审
  • 介飞;张海俊;汪锦想;于振华;宋彦 - 中国科学技术大学
  • 2022-09-19 - 2022-12-20 - G10L15/08
  • 本申请公开了一种语音样本混淆方法及装置,在该方法中,获取属于多个语音数据源的多个语音样本对应的多个样本索引;按照预设块大小对多个样本索引分块得到多个块索引;混淆多个块索引得到混淆后的多个块索引,实现多个语音数据源粒度的语音样本混淆;从混淆后的多个块索引中选取预设数量的块索引作为多个待处理块索引;将多个待处理块索引包括的样本索引划分成多个批量索引;混淆多个批量索引得到混淆后的多个批量索引,实现多个批量语音样本粒度的语音样本混淆;通过混淆后的多个批量索引包括的样本索引,获取多个待处理语音样本。由此,实现对海量语音样本的充分、全局混淆,提高模型训练过程的稳定性。
  • 一种语音样本混淆方法装置
  • [发明专利]语音活动检测模型的训练及检测方法、装置、设备和介质-CN202211345386.0在审
  • 王海平 - 广州方硅信息技术有限公司
  • 2022-10-31 - 2022-12-20 - G10L25/87
  • 本申请涉及音频及直播技术领域,提供一种语音活动检测模型训练及检测方法、装置、设备和介质。本申请能够提高语音活动检测模型的检测精确率。包括:将纯净语音信号样本分帧得到多个纯净语音信号帧样本,获取该多个信号帧样本各自对应的对数能量的归一化值,针对每一信号帧样本,获取该信号帧样本前后第一预设数量个信号帧样本中第一纯净语音信号帧样本的占比,该第一纯净语音信号帧样本为对数能量的归一化值大于阈值的信号帧样本,根据该占比确定该信号帧样本对应的语音活动检测标签,根据信号帧样本和预设噪声得到携带噪声的信号帧样本,利用携带噪声的信号帧样本语音活动检测标签对待训练的语音活动检测模型进行训练
  • 语音活动检测模型训练方法装置设备介质
  • [发明专利]语音分类模型的训练方法、装置、设备及存储介质-CN202210042806.1在审
  • 司世景;王健宗 - 平安科技(深圳)有限公司
  • 2022-01-14 - 2022-04-15 - G10L15/06
  • 本申请涉及人工智能领域,具体公开了一种语音分类模型的训练方法、装置、设备及存储介质,所述方法通过获取样本数据,所述样本数据包括样本语音和所述样本语音对应的样本标签;对所述样本语音进行预处理,得到所述样本语音对应的向量矩阵;将所述向量矩阵输入初始语音分类模型的变分信息瓶颈处理网络,得到所述样本语音对应的句子表征;将所述句子表征输入所述初始语音分类模型的分类网络得到预测标签,然后根据所述样本标签和所述预测标签对所述初始语音分类模型的进行迭代训练,从而得到训练好的语音分类模型。在语音分类模型中加入变分信息瓶颈处理网络,压缩了样本信息并抑制了无用信息,从而减小了过拟合现象的发生。
  • 语音分类模型训练方法装置设备存储介质
  • [发明专利]一种基于网络配音游戏的语音样本收集方法-CN201710389619.X有效
  • 贺前华;吴俊峰;汪星 - 华南理工大学
  • 2017-05-27 - 2020-11-24 - G10L15/00
  • 本发明提供了一种基于网络配音游戏的语音样本收集方法,包括:步骤101语音样本收集环节,通过用户点播视频,然后跟随视频字幕进行配音,配音后用户可在客户端对自己的原声进行变声处理,后台服务器端结合基于PESQ的客观语音质量评价和语音识别对原始音频进行机器打分;步骤102语音样本抽样主观评价环节,抽取语音样本在游戏首页展示,用户对展示语音样本进行试听评价后,选择“符合原文”或“不符原文”按钮,对用户选择“不符原文”按钮数量较多的语音样本,后台进行人工试听,人工试听后确实与文本不符的语音样本样本库中剔除。本发明解决了现有人工现场录制语音样本方案录制成本高、时间长,和人工电话录制方案语音样本包含信道噪声的缺点。
  • 一种基于网络配音游戏语音样本收集方法
  • [发明专利]语音识别模型的生成方法及其装置-CN201910005075.1有效
  • 徐扬凯;李超 - 百度在线网络技术(北京)有限公司
  • 2019-01-03 - 2022-06-24 - G10L15/06
  • 本发明公开了一种语音识别模型的生成方法及其装置。其中,方法包括:获取多种环境下的噪声信号,以及无噪声的样本语音信号。根据多种环境下的噪声信号和无噪声的样本语音信号,生成多种带噪声的样本语音信号。使用样本语音信号,对深度神经网络进行训练,以生成语音识别模型。其中,样本语音信号包括多种带噪声的样本语音信号和无噪声的样本语音信号。由此,实现了使用不同的样本语音信号对深度神经网络进行训练,以生成能够应对不同环境噪声的语音识别模型,增强了语音识别模型的鲁棒性。解决了现有技术中不能对不同环境下的噪声进行处理的技术问题。
  • 语音识别模型生成方法及其装置
  • [发明专利]数据清洗方法、装置及存储介质-CN202210287983.6在审
  • 王伟 - 北京小米移动软件有限公司
  • 2022-03-22 - 2022-06-10 - G10L15/22
  • 本公开涉及一种数据清洗方法、装置及存储介质,该方法包括:获取用于唤醒目标设备的语音样本数据,以及当前语音唤醒模型输出的语音样本数据对应的唤醒结果信息,唤醒结果信息用于表征目标设备是否被唤醒;确定语音样本数据与用于唤醒目标设备的标准语音唤醒数据之间的差异信息;根据唤醒结果信息和差异信息,对语音样本数据进行清洗,以确定语音样本数据的分类标签。通过上述技术方案,根据唤醒结果信息和差异信息对语音样本数据进行清洗,这样确定的语音样本数据的分类标签,相比于当前语音唤醒模型输出的唤醒结果更加准确,提高语音样本数据的标签的准确性,且无需人工对语音样本数据的标签进行标注
  • 数据清洗方法装置存储介质
  • [发明专利]豪萨语语音模型的训练方法、识别方法及装置-CN202011553156.4在审
  • 龚科;熊浩 - 暗物智能科技(广州)有限公司
  • 2020-12-24 - 2022-06-28 - G10L15/06
  • 本发明涉及语音识别技术领域,具体涉及豪萨语语音模型的训练方法、识别方法及装置,所述训练方法包括获取英语音样本及其对应的第一文本样本,以及豪萨语音样本及其对应的第二文本样本;利用英语音样本及其对应的第一文本样本对豪萨语语音模型进行训练,确定豪萨语语音模型中卷积单元的初始参数,以得到初始豪萨语语音模型,所述豪萨语语音模型包括卷积单元以及与卷积单元连接的全连接层;利用豪萨语音样本及其对应的第二文本样本对初始豪萨语语音模型进行训练,对初始参数以及全连接层的参数进行调整,以确定目标豪萨语语音模型。通过迁移学习的方法既能够避免豪萨语音样本不足的问题,又保证训练得到的豪萨语语音模型的准确性。
  • 豪萨语语音模型训练方法识别装置
  • [发明专利]语音与图像同步性衡量模型的训练方法及装置-CN202111058177.3有效
  • 王淳;曾定衡;王洪斌;吴海英;周迅溢;蒋宁 - 马上消费金融股份有限公司
  • 2021-09-09 - 2023-09-22 - G06V20/40
  • 本申请提供一种语音与图像同步性衡量模型的训练方法及装置,该方法包括:将第一图像片段处理为第一图像数据、第一语音片段处理为第一语音数据、第二语音片段处理为第二语音数据,将随机图像片段处理为第二图像数据、随机语音片段处理为第三语音数据,将第一图像数据和第一语音数据组成正样本,将第一图像数据和第二语音数据组成第一负样本,将第一图像数据和第三语音数据组成第二负样本,将第一语音数据或第二语音数据,和第二图像数据组成第三负样本,采用正样本、第一负样本、第二负样本和第三负样本训练语音与图像同步性衡量模型。这样,使得训练样本的类型更加丰富,能够提高语音与图像同步性衡量模型的精确度。
  • 语音图像同步衡量模型训练方法装置

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

400-8765-105周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top