专利名称
主分类
A 农业
B 作业;运输
C 化学;冶金
D 纺织;造纸
E 固定建筑物
F 机械工程、照明、加热
G 物理
H 电学
专利下载VIP
公布日期
2023-10-24 公布专利
2023-10-20 公布专利
2023-10-17 公布专利
2023-10-13 公布专利
2023-10-10 公布专利
2023-10-03 公布专利
2023-09-29 公布专利
2023-09-26 公布专利
2023-09-22 公布专利
2023-09-19 公布专利
更多 »
专利权人
国家电网公司
华为技术有限公司
浙江大学
中兴通讯股份有限公司
三星电子株式会社
中国石油化工股份有限公司
清华大学
鸿海精密工业股份有限公司
松下电器产业株式会社
上海交通大学
更多 »
钻瓜专利网为您找到相关结果228个,建议您升级VIP下载更多相关专利
  • [发明专利]语音转换方法、装置、设备及可读存储介质-CN201910506086.8有效
  • 王燕南;黄俊;陈家君;王青 - 腾讯科技(深圳)有限公司
  • 2019-06-12 - 2023-09-15 - G10L21/007
  • 本申请公开了一种语音转换方法、装置、设备及可读存储介质,涉及音频处理领域。该方法包括:获取源语音,源语音为以第一人声发出的语音;提取源语音的音素后验概率;通过编码器对音素后验概率进行编码处理,得到编码层特征;通过解码器对编码层特征进行解码处理,得到频谱特征,编码器和解码器是通过第二人声的样本语音训练得到的;将频谱特征进行语音合成处理,得到第二人声的目标语音。通过编码器和解码器对PPGs进行处理,得到频谱特征后,通过频谱特征对目标语音进行合成,由编码器和解码器两层结构对PPGs进行处理,提高了对第二人声的语音情感以及语音韵律的把控,提高了目标语音与第二人声实际发出的声音之间的相似度。
  • 语音转换方法装置设备可读存储介质
  • [发明专利]生成音效参数的方法、装置及存储介质-CN201811302799.4有效
  • 陈琳琳;彭学杰;刘佳泽;陈普森 - 广州酷狗计算机科技有限公司
  • 2018-11-02 - 2023-09-01 - G10L21/007
  • 本发明公开了一种生成音效参数的方法、装置及存储介质,属于电子技术领域。所述方法包括:获取目标音乐集合,该目标音乐集合包括目标演唱者所演唱的至少一首音乐;对该目标音乐集合中的音乐进行分析,并根据分析结果确定该目标演唱者的音乐演唱特征;根据该目标演唱者的音乐演唱特征生成目标音效参数;在音乐播放装置接收到针对该目标演唱者演唱的音乐的播放指令后,该音乐播放装置获取该目标音效参数,根据该目标音效参数对该目标演唱者演唱的音乐进行音效处理,并对进行音效处理后的该目标演唱者演唱的音乐进行播放。本发明实施例提供的生成音效参数的方法能够提高对音乐进行音效处理的灵活性。
  • 生成音效参数方法装置存储介质
  • [发明专利]基于改进型编码器的语音转换方法和装置、电子设备-CN202310638471.4在审
  • 郭洋;王健宗 - 平安科技(深圳)有限公司
  • 2023-05-31 - 2023-08-29 - G10L21/007
  • 本申请实施例提供了一种基于改进型编码器的语音转换方法和装置、电子设备,属于金融科技领域。该方法包括:获取待转换的目标说话人语料的目标梅尔频谱特征;基于第一预设神经网络对目标梅尔频谱特征进行预处理,得到中间特征结果;基于第二预设神经网络获取对应于中间特征结果的高斯分布均值和高斯分布方差;根据高斯分布均值和高斯分布方差确定特征分布空间;在特征分布空间中进行随机采样,得到目标说话人嵌入向量;将目标说话人嵌入向量输入到预训练的语音转换网络中,得到重构的转换梅尔频谱特征;根据转换梅尔频谱特征生成目标转换语料。本申请实施例,有利于扩展语音转换模型的建模能力和应用场景,提高语音转换过程的稳定性。
  • 基于改进型编码器语音转换方法装置电子设备
  • [发明专利]音频修复方法、装置、计算机设备和存储介质-CN202310672388.9在审
  • 徐雪;张驰;杨洁琼;江文乐 - 中国工商银行股份有限公司
  • 2023-06-08 - 2023-08-22 - G10L21/007
  • 本申请涉及一种音频修复方法、装置、计算机设备、存储介质和计算机程序产品,可用于音频处理技术领域,也可用于金融科技领域或其他相关领域。该方法包括:获取金融系统的待修复音频的原始频谱图;对原始频谱图进行特征提取处理,得到待修复音频的原始频谱特征图,对原始频谱特征图进行不同倍数的下采样处理,得到待修复音频的多个尺度的频谱特征图;对各个尺度的频谱特征图进行特征提取处理,得到各个尺度的目标频谱特征图;根据待修复音频和各个尺度的目标频谱特征图,进行音频重建处理,得到待修复音频的目标频谱图;对目标频谱图进行音频转化,得到待修复音频的修复音频。采用本方法,能够提高音频修复效果。
  • 音频修复方法装置计算机设备存储介质
  • [发明专利]基于hi35xx平台的软件混音方法-CN202310519597.X在审
  • 陈晨 - 国科环宇(南京)电子技术有限公司
  • 2023-05-09 - 2023-08-18 - G10L21/007
  • 本发明公开了基于hi35xx平台的软件混音方法,包括以下方法:步骤S1:初始化工作模块;步骤S2:创建拉流解码线程,将码流送入解码器进行解码,解码后的数据由海思芯片自动放入缓存池;步骤S3:将步骤S1和步骤S2中获得的音频数据创建混音线程,以阻塞方式从解码通道中获取音频帧数据,从而获取码流数目;步骤S4:将步骤S3中的码流数目进行分析;如果只有一路音频码流,则不需要混音。本发明自动识别当前场景是否需要混音,在单路码流时避免冗余计算,减少系统的多余开销,混音算法中的衰减因子可以自适应调节,当数据溢出时,则相应地使因子变小,使后续的数据衰减后处于临界范围内,没有溢出时,衰减因子慢慢变大,使数据变化相对平滑。
  • 基于hi35xx平台软件方法
  • [发明专利]一种语音风格的转换方法、装置、设备和存储介质-CN202010104395.5有效
  • 娄帆 - 广州市百果园信息技术有限公司
  • 2020-02-20 - 2023-08-11 - G10L21/007
  • 本发明实施例公开了一种语音风格的转换方法、装置、设备和存储介质。其中,该方法包括:获取源风格语音、目标风格语音和初始转换语音;根据初始转换语音和源风格语音之间的语音内容损失以及初始转换语音和目标风格语音之间的语音风格损失,对初始转换语音进行损失优化,得到新的初始转换语音继续进行损失优化,直至新的初始转换语音满足预设的损失优化条件,则将新的初始转换语音作为源风格语音在目标风格下的风格转换语音。本发明实施例提供的技术方案,实现源风格语音在目标风格下的准确转换,无需针对该目标风格进行语音风格转换的预先训练,保证未经过预先训练的目标语音下的语音风格转换,提高语音风格转换的全面性和准确性。
  • 一种语音风格转换方法装置设备存储介质
  • [发明专利]模型更新方法和装置、语音转换方法、设备及存储介质-CN202310638552.4在审
  • 张旭龙;王健宗;唐怀朕 - 平安科技(深圳)有限公司
  • 2023-05-31 - 2023-08-04 - G10L21/007
  • 本申请提供了一种模型更新方法和装置、语音转换方法、设备及存储介质,属于金融科技技术领域。该方法包括:获取样本语音数据;将样本语音数据输入至神经网络模型中;通过编码网络对样本语音数据进行编码处理,得到初始音频特征向量;基于预设码本对初始音频特征向量进行索引查询,得到音频帧索引,基于音频帧索引对初始音频特征向量进行音素特征提取,得到初始音素特征向量;对初始音素特征向量进行语音对齐,得到样本音频嵌入向量;通过解码网络对样本音频嵌入向量和说话风格嵌入向量进行解码处理,得到合成语音数据;基于合成语音数据和样本语音数据对神经网络模型进行参数更新,得到语音转换模型。本申请能够提高模型对语音转换的准确性。
  • 模型更新方法装置语音转换设备存储介质
  • [发明专利]语音转换方法、语音模型训练方法、装置、设备及介质-CN202310446782.0在审
  • 郭洋;王健宗 - 平安科技(深圳)有限公司
  • 2023-04-14 - 2023-07-21 - G10L21/007
  • 本发明适用于语音转换领域,尤其涉及一种语音转换方法、语音模型训练方法、装置、设备及介质。本发明实施例将样本语音波形输入至内容编码器得到内容特征,将参考语音波形输入至语音编码器得到说话人特征,并将内容特征、说话人特征输入至生成器进行N次上采样处理和残差连接处理,得到N个预设频率依次升高的音频波形,通过在生成器端逐步加入上采样、在判别器端逐步加入下采样的步进方法,在提高了语音转换模型训练速度的同时,提高了音频波形的稳定性和准确性,并通过判别器和基频提取模型得到判别结果和基频,用于监督语音转换模型的训练,保证了生成的语音波形的内容和音色音调不变性,提高了语音转换模型的准确率。
  • 语音转换方法模型训练装置设备介质

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

400-8765-105周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top