“G10L21/007”专利分类搜索_专利查询_文献下载_出售_求购_买卖_交易

钻瓜专利网为您找到相关结果228个，建议您升级VIP下载更多相关专利

[发明专利]音频处理方法、装置、电子设备及可读存储介质-CN202310952271.6在审
发明人：马丹 -专利权人：咪咕文化科技有限公司;中国移动通信集团有限公司
申请日： 2023-07-31 - 公布日： 2023-10-20 - 主分类号： G10L21/007 文献下载
摘要：本申请公开了一种音频处理方法、装置、电子设备及可读存储介质，属于人工智能技术领域。本申请实施例的音频处理方法包括：获取待处理音频；将待处理音频输入到预训练音频模型的编码器中，获得所述待处理音频对应的插件参数簇；将所述待处理音频和所述插件参数簇输入到预训练音频模型的音频插件层中，利用所述插件参数簇对所述待处理音频进行渲染，获得具有所述音频插件层对应的音频效果的目标音频。由此，相比于人工处理方式，可以提升音频处理效率。
音频处理方法装置电子设备可读存储介质

[发明专利]语音处理方法、装置、电子设备及存储介质-CN201910227101.5有效
发明人：陈岩 -专利权人： OPPO广东移动通信有限公司
申请日： 2019-03-25 - 公布日： 2023-10-20 - 主分类号： G10L21/007 文献下载
摘要：本公开提供了一种语音处理方法、装置、电子设备及计算机可读存储介质，涉及音频处理技术领域，所述语音处理方法包括：接收由音频采集设备获取并发送的语音信号；对所述语音信号对应的时域信号进行用于调整采样频率的变调处理，得到变调后的语音信号；将变调后的语音信号对应的时域信号进行播放时间保持，以得到目标语音信号；其中，所述变调后的语音信号的播放时间与所述语音信号的播放时间相同。本公开能够快速精准地进行语音变调。
语音处理方法装置电子设备存储介质

[发明专利]一种基于语音样本的游戏语音转换方法及装置-CN202310905011.3在审
发明人：黄志松;李鹤;周义;姚茜 -专利权人：清枫（北京）科技有限公司
申请日： 2023-07-21 - 公布日： 2023-09-22 - 主分类号： G10L21/007 文献下载
摘要：本申请提供了一种基于语音样本的游戏语音转换方法及装置。该方法包括：响应于用户选定游戏人物的选定消息，获取游戏人物的语音样本；根据语音样本确定语音信息；在游戏中，将用户所讲的语音根据语音信息转换为游戏人物的游戏语音。本申请通过获取游戏人物的语音样本，根据语音样本确定语音信息，在游戏中，将用户所讲的语音根据语音信息转换为游戏人物的游戏语音，避免直接将用户开麦后的环境声音与游戏特效声音融合，从而可以避免声音混乱，变为嘈杂的声音，以解决影响游戏效果的问题。
一种基于语音样本游戏转换方法装置

[发明专利]语音转换方法、装置、设备及可读存储介质-CN201910506086.8有效
发明人：王燕南;黄俊;陈家君;王青 -专利权人：腾讯科技（深圳）有限公司
申请日： 2019-06-12 - 公布日： 2023-09-15 - 主分类号： G10L21/007 文献下载
摘要：本申请公开了一种语音转换方法、装置、设备及可读存储介质，涉及音频处理领域。该方法包括：获取源语音，源语音为以第一人声发出的语音；提取源语音的音素后验概率；通过编码器对音素后验概率进行编码处理，得到编码层特征；通过解码器对编码层特征进行解码处理，得到频谱特征，编码器和解码器是通过第二人声的样本语音训练得到的；将频谱特征进行语音合成处理，得到第二人声的目标语音。通过编码器和解码器对PPGs进行处理，得到频谱特征后，通过频谱特征对目标语音进行合成，由编码器和解码器两层结构对PPGs进行处理，提高了对第二人声的语音情感以及语音韵律的把控，提高了目标语音与第二人声实际发出的声音之间的相似度。
语音转换方法装置设备可读存储介质

[发明专利]生成音效参数的方法、装置及存储介质-CN201811302799.4有效
发明人：陈琳琳;彭学杰;刘佳泽;陈普森 -专利权人：广州酷狗计算机科技有限公司
申请日： 2018-11-02 - 公布日： 2023-09-01 - 主分类号： G10L21/007 文献下载
摘要：本发明公开了一种生成音效参数的方法、装置及存储介质，属于电子技术领域。所述方法包括：获取目标音乐集合，该目标音乐集合包括目标演唱者所演唱的至少一首音乐；对该目标音乐集合中的音乐进行分析，并根据分析结果确定该目标演唱者的音乐演唱特征；根据该目标演唱者的音乐演唱特征生成目标音效参数；在音乐播放装置接收到针对该目标演唱者演唱的音乐的播放指令后，该音乐播放装置获取该目标音效参数，根据该目标音效参数对该目标演唱者演唱的音乐进行音效处理，并对进行音效处理后的该目标演唱者演唱的音乐进行播放。本发明实施例提供的生成音效参数的方法能够提高对音乐进行音效处理的灵活性。
生成音效参数方法装置存储介质

[发明专利]基于改进型编码器的语音转换方法和装置、电子设备-CN202310638471.4在审
发明人：郭洋;王健宗 -专利权人：平安科技（深圳）有限公司
申请日： 2023-05-31 - 公布日： 2023-08-29 - 主分类号： G10L21/007 文献下载
摘要：本申请实施例提供了一种基于改进型编码器的语音转换方法和装置、电子设备，属于金融科技领域。该方法包括：获取待转换的目标说话人语料的目标梅尔频谱特征；基于第一预设神经网络对目标梅尔频谱特征进行预处理，得到中间特征结果；基于第二预设神经网络获取对应于中间特征结果的高斯分布均值和高斯分布方差；根据高斯分布均值和高斯分布方差确定特征分布空间；在特征分布空间中进行随机采样，得到目标说话人嵌入向量；将目标说话人嵌入向量输入到预训练的语音转换网络中，得到重构的转换梅尔频谱特征；根据转换梅尔频谱特征生成目标转换语料。本申请实施例，有利于扩展语音转换模型的建模能力和应用场景，提高语音转换过程的稳定性。
基于改进型编码器语音转换方法装置电子设备

[发明专利]音频修复方法、装置、计算机设备和存储介质-CN202310672388.9在审
发明人：徐雪;张驰;杨洁琼;江文乐 -专利权人：中国工商银行股份有限公司
申请日： 2023-06-08 - 公布日： 2023-08-22 - 主分类号： G10L21/007 文献下载
摘要：本申请涉及一种音频修复方法、装置、计算机设备、存储介质和计算机程序产品，可用于音频处理技术领域，也可用于金融科技领域或其他相关领域。该方法包括：获取金融系统的待修复音频的原始频谱图；对原始频谱图进行特征提取处理，得到待修复音频的原始频谱特征图，对原始频谱特征图进行不同倍数的下采样处理，得到待修复音频的多个尺度的频谱特征图；对各个尺度的频谱特征图进行特征提取处理，得到各个尺度的目标频谱特征图；根据待修复音频和各个尺度的目标频谱特征图，进行音频重建处理，得到待修复音频的目标频谱图；对目标频谱图进行音频转化，得到待修复音频的修复音频。采用本方法，能够提高音频修复效果。
音频修复方法装置计算机设备存储介质

[发明专利]基于hi35xx平台的软件混音方法-CN202310519597.X在审
发明人：陈晨 -专利权人：国科环宇（南京）电子技术有限公司
申请日： 2023-05-09 - 公布日： 2023-08-18 - 主分类号： G10L21/007 文献下载
摘要：本发明公开了基于hi35xx平台的软件混音方法，包括以下方法：步骤S1：初始化工作模块；步骤S2：创建拉流解码线程，将码流送入解码器进行解码，解码后的数据由海思芯片自动放入缓存池；步骤S3：将步骤S1和步骤S2中获得的音频数据创建混音线程，以阻塞方式从解码通道中获取音频帧数据，从而获取码流数目；步骤S4：将步骤S3中的码流数目进行分析；如果只有一路音频码流，则不需要混音。本发明自动识别当前场景是否需要混音，在单路码流时避免冗余计算，减少系统的多余开销，混音算法中的衰减因子可以自适应调节，当数据溢出时，则相应地使因子变小，使后续的数据衰减后处于临界范围内，没有溢出时，衰减因子慢慢变大，使数据变化相对平滑。
基于 hi35xx 平台软件方法

[发明专利]语音转换处理方法、装置、计算机设备及存储介质-CN202310685998.2在审
发明人：郭洋;王健宗 -专利权人：平安科技（深圳）有限公司
申请日： 2023-06-09 - 公布日： 2023-08-15 - 主分类号： G10L21/007 文献下载
摘要：本申请涉及人工智能、语音转换技术领域，公开了一种语音转换处理方法，能够转换为多样性丰富的语音。方法部分包括：获取输入梅尔谱，并获取多个不同目标语音域的参考梅尔谱；将输入梅尔谱输入预先训练好的生成器的编码器，得到隐变量特征，并将输入梅尔谱输入基频提取网络，得到基频特征；将多个参考梅尔谱分别输入风格编码器，得到多个风格编码；将每组输入数据输入到生成器的解码器中，得到多组输出梅尔谱，各组输入数据包括隐变量特征、基频特征以及不同的风格编码；基于多组输出梅尔谱转换出对应的音频，得到多组目标语音。
语音转换处理方法装置计算机设备存储介质

[发明专利]一种会议音频混音方法和装置-CN202110915604.9有效
发明人：陈东恺;庄仁峰;胡文辉;郑敏;吴华挚;孙立军;谭俊;宁志刚;林德煜;江继针;肖聪;梁祯夏;阮晓军;江旭;刘哲;潘一佩;陈锦坤;李刚;项华杰;梁照江;刘雄威;覃复慧;张子成;王磊;彭星桂;卓彩霞;李盛阁 -专利权人：中移互联网有限公司;中国移动通信集团有限公司
申请日： 2021-08-10 - 公布日： 2023-08-15 - 主分类号： G10L21/007 文献下载
摘要：本发明公开了一种会议音频混音方法和装置，用以解决会议音频混音的处理负荷高的问题，本申请提供的方案包括：接收多路待混音的会议音频，所述多路待混音的会议音频由参与会议的多个音频设备发送；对多路所述待混音的会议音频执行解封；对解封后的多路会议音频执行混音，得到混音后的会议音频；对所述混音后的会议音频执行封装，封装后的会议音频用于输出至参与会议的至少一个音频设备。本发明将多路待混音的会议音频集中执行混音，避免重复执行混音，能提高混音效率。而且，混音后的会议音频能复用于多个音频设备，无需重复处理，降低混音处理负荷。
一种会议音频方法装置

[发明专利]一种建筑工地场界噪声背景干扰在线修正方法及系统-CN202310848912.3在审
发明人：毛庆国;徐怀洲;王宏;许盛彬 -专利权人：南方科技大学;深圳市生态环境智能管控中心
申请日： 2023-07-12 - 公布日： 2023-08-11 - 主分类号： G10L21/007 文献下载
摘要：本发明涉及一种建筑工地场界噪声背景干扰在线修正方法及系统，方法包括：实时获取建筑工地场界噪声的声压级数据，并基于声压级数据生成第一时间序列数据；实时获取建筑工地施工状态监测信息数据，并基于施工状态监测信息数据生成第二时间序列数据；基于第一时间序列数据和第二时间序列数据，获取统一时间序列的数据集，并基于统一时间序列的数据集，获取非施工状态监测数据集和施工状态监测数据集；获取监测时段的需求信息，并根据需求信息采用预先设定的第一处理方式，获取原数据；基于监测时段的需求信息，针对统一时间序列的数据集进行第二处理方式，获取背景噪音；基于原数据和背景噪音，采用预先设定策略修正所述背景噪音，并输出修正值。
一种建筑工地噪声背景干扰在线修正方法系统

[发明专利]一种语音风格的转换方法、装置、设备和存储介质-CN202010104395.5有效
发明人：娄帆 -专利权人：广州市百果园信息技术有限公司
申请日： 2020-02-20 - 公布日： 2023-08-11 - 主分类号： G10L21/007 文献下载
摘要：本发明实施例公开了一种语音风格的转换方法、装置、设备和存储介质。其中，该方法包括：获取源风格语音、目标风格语音和初始转换语音；根据初始转换语音和源风格语音之间的语音内容损失以及初始转换语音和目标风格语音之间的语音风格损失，对初始转换语音进行损失优化，得到新的初始转换语音继续进行损失优化，直至新的初始转换语音满足预设的损失优化条件，则将新的初始转换语音作为源风格语音在目标风格下的风格转换语音。本发明实施例提供的技术方案，实现源风格语音在目标风格下的准确转换，无需针对该目标风格进行语音风格转换的预先训练，保证未经过预先训练的目标语音下的语音风格转换，提高语音风格转换的全面性和准确性。
一种语音风格转换方法装置设备存储介质

[发明专利]模型更新方法和装置、语音转换方法、设备及存储介质-CN202310638552.4在审
发明人：张旭龙;王健宗;唐怀朕 -专利权人：平安科技（深圳）有限公司
申请日： 2023-05-31 - 公布日： 2023-08-04 - 主分类号： G10L21/007 文献下载
摘要：本申请提供了一种模型更新方法和装置、语音转换方法、设备及存储介质，属于金融科技技术领域。该方法包括：获取样本语音数据；将样本语音数据输入至神经网络模型中；通过编码网络对样本语音数据进行编码处理，得到初始音频特征向量；基于预设码本对初始音频特征向量进行索引查询，得到音频帧索引，基于音频帧索引对初始音频特征向量进行音素特征提取，得到初始音素特征向量；对初始音素特征向量进行语音对齐，得到样本音频嵌入向量；通过解码网络对样本音频嵌入向量和说话风格嵌入向量进行解码处理，得到合成语音数据；基于合成语音数据和样本语音数据对神经网络模型进行参数更新，得到语音转换模型。本申请能够提高模型对语音转换的准确性。
模型更新方法装置语音转换设备存储介质

[发明专利]音色转换方法、装置、电子设备及可读存储介质-CN202310343473.0在审
发明人：王愈;陈明;李健;武卫东 -专利权人：北京捷通华声科技股份有限公司
申请日： 2023-03-31 - 公布日： 2023-07-21 - 主分类号： G10L21/007 文献下载
摘要：本发明实施例提供了一种音色转换方法、装置、电子设备及存储介质，包括：将发音人员的第一音素后验概率向量PPGs序列进行降采样过滤，生成第二PPGs序列，将第二PPGs序列输入持续时间预测模块，输出时长预测结果，根据时长预测结果对第二PPGs序列进行拓展，生成第三PPGs序列，将第三PPGs序列输入目标模块完成目标人员的音色转换，本发明实施例通过在经典技术框架的基础上，针对目标人员的语速特色进行专项建模，生成语音中各字的节奏和吐字，都能较大程度地剥离掉输入语音的特色，而更贴近目标人员的特色，大大提高了音质的相似度。
音色转换方法装置电子设备可读存储介质

[发明专利]语音转换方法、语音模型训练方法、装置、设备及介质-CN202310446782.0在审
发明人：郭洋;王健宗 -专利权人：平安科技（深圳）有限公司
申请日： 2023-04-14 - 公布日： 2023-07-21 - 主分类号： G10L21/007 文献下载
摘要：本发明适用于语音转换领域，尤其涉及一种语音转换方法、语音模型训练方法、装置、设备及介质。本发明实施例将样本语音波形输入至内容编码器得到内容特征，将参考语音波形输入至语音编码器得到说话人特征，并将内容特征、说话人特征输入至生成器进行N次上采样处理和残差连接处理，得到N个预设频率依次升高的音频波形，通过在生成器端逐步加入上采样、在判别器端逐步加入下采样的步进方法，在提高了语音转换模型训练速度的同时，提高了音频波形的稳定性和准确性，并通过判别器和基频提取模型得到判别结果和基频，用于监督语音转换模型的训练，保证了生成的语音波形的内容和音色音调不变性，提高了语音转换模型的准确率。
语音转换方法模型训练装置设备介质

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
下一页»
尾页
共 228 条