“亢祖衡”申请（专利权）人搜索_中国专利权人_发明人_技术持有人_科研专家_钻瓜专利网

钻瓜专利网为您找到相关结果12个，建议您升级VIP下载更多相关专利

[发明专利]模型训练方法、动作姿态生成方法、装置、设备及介质-CN202110455733.4有效
发明人： 亢祖衡;彭俊清;王健宗 -专利权人：平安科技（深圳）有限公司
申请日： 2021-04-26 - 公布日： 2023-09-26 - 主分类号： G06V10/774 文献下载
摘要：本发明实施例公开了一种模型训练方法、动作姿态生成方法、装置、设备及介质。本发明涉及生物识别技术领域，该方法包括：训练动作姿态生成模型，获取机器人生成动作姿态所对应的语音信息并进行特征提取及特征融合以生成多个融合特征向量；对每个融合特征向量与机器人初始姿态自回归向量进行特征融合以生成控制输入向量；将随机生成的潜在输入向量及控制输入向量输入动作姿态生成模型以生成机器人姿态动作向量；更新预设初始姿态动作向量集中的机器人姿态动作向量，并将预设初始姿态动作向量集作为目标姿态动作向量集，根据目标姿态动作向量集生成机器人动作姿态。本发明实施例可节约动作姿态生成的成本及提高动作姿态生成的效果。
模型训练方法动作姿态生成装置设备介质

[发明专利]钢琴弹奏视频生成方法、装置、计算机设备及存储介质-CN202310638047.X在审
发明人： 亢祖衡;彭俊清;王健宗;肖京 -专利权人：平安科技（深圳）有限公司
申请日： 2023-05-31 - 公布日： 2023-08-29 - 主分类号： G10L21/10 文献下载
摘要：本发明涉及语音分析领域，尤其涉及一种钢琴弹奏视频生成方法、装置、计算机设备及存储介质。其方法包括：获取音频流数据；将音频流数据输入音频编码器进行编码处理，得到音频编码；通过钢琴视频代码转换模型对音频编码进行代码转换，得到钢琴视频代码薄序列；通过钢琴视频代码薄解码器对钢琴视频代码薄序列进行解码处理，得到钢琴视频流数据；钢琴视频流数据是指人手在钢琴上弹奏与音频编码对应的音乐的视频流；将钢琴视频流数据和音频流数据进行合并，得到钢琴弹奏视频。本发明将音频流数据转换为具有人手弹奏钢琴的画面的视频流数据，并最终生成既包含音频又包含人手在钢琴上弹奏该音频的视频，使视频效果和质量更好，提高用户体验感。
钢琴弹奏视频生成方法装置计算机设备存储介质

[发明专利]钢琴演奏音频生成方法、装置、计算机设备及存储介质-CN202310446814.7在审
发明人： 亢祖衡;彭俊清;王健宗;肖京 -专利权人：平安科技（深圳）有限公司
申请日： 2023-04-14 - 公布日： 2023-07-28 - 主分类号： G10H1/00 文献下载
摘要：本发明涉及人工智能领域，尤其涉及一种钢琴演奏音频生成方法、装置、计算机设备及存储介质。其方法包括：获取钢琴演奏事件数据；将钢琴演奏事件数据输入事件编码器进行事件编码，得到钢琴演奏事件编码；通过音频代码转换模型对钢琴演奏事件编码进行代码转换，得到梅尔频谱编码；通过梅尔频谱生成器对梅尔频谱编码进行解码，得到梅尔频谱数据；将梅尔频谱数据输入声码器中进行还原，得到钢琴演奏音频。本发明将钢琴弹奏事件转化为钢琴弹奏音频，考虑了钢琴弦之间共振产生的声音，使得到的钢琴弹奏音频具有泛音更加生动逼真。
钢琴演奏音频生成方法装置计算机设备存储介质

[发明专利]声纹识别模型的优化方法、装置、计算机设备及存储介质-CN202110733702.0有效
发明人： 亢祖衡;彭俊清;王健宗 -专利权人：平安科技（深圳）有限公司
申请日： 2021-06-30 - 公布日： 2023-05-23 - 主分类号： G10L17/04 文献下载
摘要：本申请公开了声纹识别模型的优化方法、装置、计算机设备及存储介质，涉及人工智能技术领域，用于针对线上用户进行实时优化，提高了模型的准确率。方法包括：将预置的初始声纹识别模型分别部署到多个终端；获取目标终端发送的待识别语音数据；通过预置的历史存量数据对待识别语音数据进行声纹核身操作；当待识别语音数据通过声纹核身操作时，将多个匿名声纹向量确定为负样例数据并发送至目标终端，以使得目标终端进行梯度计算；获取多个关联终端发送的多个关联模型梯度，并采用联邦聚合平均算法对多个关联模型梯度和目标模型梯度进行聚合，得到聚合梯度；将聚合梯度发送到多个终端，以使得每个终端根据聚合梯度对初始声纹识别模型进行优化。
声纹识别模型优化方法装置计算机设备存储介质

[发明专利]鸟声识别模型的构建方法、装置、计算机设备及存储介质-CN201910390381.1有效
发明人：吴冀平;亢祖衡;彭俊清;王健宗 -专利权人：平安科技（深圳）有限公司
申请日： 2019-05-10 - 公布日： 2023-01-20 - 主分类号： G10L17/26 文献下载
摘要：本发明涉及声音识别领域，公开了一种鸟声识别模型的构建方法、装置、计算机设备及存储介质。其方法包括：获取鸟声样本，鸟声样本包括声音片段，每个鸟声样本与一个鸟名标签对应；从声音片段中提取梅尔频率倒谱特征，获得声音片段的多个频谱图；对多个频谱图进行特征提取和降维处理，获得声音片段对应的特征图；将特征图进行声纹特征编码处理，获得声纹特征向量；将声纹特征向量输入胶囊网络进行训练，训练完毕后获得鸟声识别模型，鸟声识别模型包括训练完毕后的胶囊网络。本发明所获得鸟声识别模型可用于对包含鸟声的声音片段进行处理，识别出鸟的类别。
鸟声识别模型构建方法装置计算机设备存储介质

[发明专利]环境声音生成方法、装置、计算机设备及存储介质-CN202210903105.2在审
发明人： 亢祖衡;彭俊清;王健宗;肖京 -专利权人：平安科技（深圳）有限公司
申请日： 2022-07-29 - 公布日： 2022-11-01 - 主分类号： G10L13/047 文献下载
摘要：本发明涉及人工智能技术领域，本发明公开了一种环境声音生成方法、装置、计算机设备及存储介质。该方法通过获取用户需求的环境音标签数据，对环境音标签数据中的环境音频数据和所述环境音频数据对应的时间标识进行向量化处理，得到环境音标签数据所对应的环境音标签向量，以用于后续的环境声音生成；采用基于生成对抗网络构建的环境音生成模型，对环境音标签向量进行处理得到所生成环境声音所对应的目标频谱图，并通过目标声码器对目标频谱图进行转化处理，以获取获取环境音标签数据中的每一时间标识所对应的目标环境声音，从而满足用户在不同的需求，提高了所生成环境声音的真实性。
环境声音生成方法装置计算机设备存储介质

[发明专利]语音情绪转换方法、语音情绪转换装置、设备和存储介质-CN202210906391.8在审
发明人： 亢祖衡;彭俊清;王健宗;肖京 -专利权人：平安科技（深圳）有限公司
申请日： 2022-07-29 - 公布日： 2022-11-01 - 主分类号： G10L25/63 文献下载
摘要：本申请实施例提供了一种语音情绪转换方法、语音情绪转换装置、设备和存储介质，属于人工智能技术领域。该方法包括：获取初始情绪音频的初始频谱数据和初始情绪标签；根据音频代码簿模型对初始频谱数据进行编码，得到第一编码数据；根据音高提取算法对初始频谱数据进行音高提取，得到目标音高信息；获取目标情绪标签，并根据第一编码数据、目标音高信息、初始情绪标签和目标情绪标签进行编码合成，得到第二编码数据；将第二编码数据输入至预训练的翻译模型进行编码翻译，得到目标代码簿序列信息；根据目标代码簿序列信息生成目标频谱数据；对目标频谱数据进行声码还原，得到目标情绪音频。本申请实施例能够提高语音情绪转换的效率和准确性。
语音情绪转换方法装置设备存储介质

[发明专利]语音情绪识别模型训练方法、装置、计算机设备及介质-CN202210897694.8在审
发明人： 亢祖衡;彭俊清;王健宗;肖京 -专利权人：平安科技（深圳）有限公司
申请日： 2022-07-28 - 公布日： 2022-09-23 - 主分类号： G10L15/02 文献下载
摘要：本发明公开了一种语音情绪识别模型训练方法，获取音素语音特征、性别语音特征和情绪语音特征；音素语音特征关联音素语音标签，性别语音特征关联性别语音标签，情绪语音特征关联情绪坐标标签；输入至包含初始参数的预设识别模型中；获取预设识别模型的输出特征向量；基于第一特征向量，获取预测音素标签；基于输出特征向量，获取预测性别标签和预测情绪标签；根据预测音素标签、预测性别标签、预测情绪标签、音素语音标签、性别语音标签和情绪坐标标签，确定预测损失值；在预测损失值未达到预设收敛条件时，迭代更新预设识别模型中的初始参数，直至预测损失值达到收敛条件时，记录为语音情绪识别模型。本发明提高了语音情绪识别的准确率。
语音情绪识别模型训练方法装置计算机设备介质

[发明专利]自动推送助眠乐曲方法、装置、计算机设备及存储介质-CN201910882719.5有效
发明人：王健宗;亢祖衡;彭俊清 -专利权人：平安科技（深圳）有限公司
申请日： 2019-09-18 - 公布日： 2022-06-03 - 主分类号： A61M21/02 文献下载
摘要：本发明涉及人工智能技术领域，提供了一种自动推送助眠乐曲方法、装置、计算机设备及存储介质，所述自动推送助眠乐曲方法包括：以预设时间间隔获取目标用户在睡眠时采集到的电压信号和脑电信号；对所述电压信号进行向量转换，得到特征向量；对所述脑电信号进行图转换处理，得到频谱图；将所述特征向量和所述频谱图导入预先训练好的睡眠检测模型中进行识别，得到睡眠状态；基于预设条件，获取所述睡眠状态对应的助眠音乐推荐类型；根据所述助眠音乐推荐类型，为所述目标用户推送助眠乐曲。从而实现准确为目标用户推送助眠音乐，进一步提高目标用户的睡眠质量。
自动推送乐曲方法装置计算机设备存储介质

[发明专利]一种超分辨率音频生成方法、计算机设备及存储介质-CN202210043395.8在审
发明人： 亢祖衡;彭俊清;王健宗 -专利权人：平安科技（深圳）有限公司
申请日： 2022-01-14 - 公布日： 2022-04-26 - 主分类号： G10L21/007 文献下载
摘要：本申请实施例提供一种超分辨率音频生成方法、计算机设备及存储介质，涉及信号处理技术领域，其中超分辨率音频生成方法包括：将低分辨率音频输入包括生成器和判别器的生成对抗网络的音频样本生成模型，输出超分辨率音频样本，基于超分辨率音频的频谱特征集合和低分辨率音频的频谱特征集合，进行特征融合，得到目标全频带频谱，通过频域变换的逆变换得到目标全频带频谱对应的音频，即超分辨率音频，由于本方案中，将原始的低分辨率音频的频谱特征集合与通过音频样本生成模型生成的超分辨率音频样本的频谱特征集合进行融合，进而基于特征融合得到的目标全频带频谱得到超分辨率音频，避免了原始音频的特征信息丢失，提高了生成音频的质量。
一种分辨率音频生成方法计算机设备存储介质

[发明专利]音频单音色分离方法、装置、计算机设备及存储介质-CN201910511337.1在审
发明人：吴冀平;亢祖衡;彭俊清;王健宗 -专利权人：平安科技（深圳）有限公司
申请日： 2019-06-13 - 公布日： 2019-10-15 - 主分类号： G10L21/0272 文献下载
摘要：本发明公开了一种音频单音色分离方法、装置、计算机设备及存储介质，应用于音频处理技术领域，用于解决现有技术无法实现单音色分离的问题。本发明提供的方法包括：获取待音频分离的目标音频；确定针对目标音频所需分离的各个音色种类；从预先训练好的各个LSTM神经网络中选取出与各个音色种类对应的一个LSTM神经网络，作为目标LSTM神经网络，各个LSTM神经网络分别采用不同的音色种类组合所对应的音频样本预先训练得到，每个音色种类组合由两个以上音色种类组成；将目标音频作为输入投入至目标LSTM神经网络，得到输出的各个目标频谱图；将各个目标频谱图分别进行时域变换，得到各个目标频谱图各自对应的目标单音色音频，作为目标音频的音频分离结果。
音色神经网络目标音频目标频谱计算机设备存储介质音频处理技术分离结果时域变换音频样本种类组成取出输出应用

[发明专利]检测基频的方法、装置及计算机可读存储介质-CN201910374209.7在审
发明人：彭俊清;亢祖衡;王健宗 -专利权人：平安科技（深圳）有限公司
申请日： 2019-05-07 - 公布日： 2019-09-06 - 主分类号： G06K9/00 文献下载
摘要：本申请提出一种检测基频的方法、装置及计算机可读存储介质，以快速、准确地从各种环境中检测含混噪声的音频信号中的基频。所述方法包括：选择用于训练基频检测神经网络的训练集；使用训练集对基频检测神经网络进行训练，得到已训练基频检测神经网络；采用已训练基频检测神经网络对混含噪声的音频进行基频检测。本申请提供的技术方案使得能够快速、准确地从各种环境中检测含混噪声的音频信号中的基频。
基频检测神经网络基频计算机可读存储介质噪声音频信号训练集检测种检测申请

1
共 12 条