“G10L25/24”专利分类搜索_专利查询_文献下载_出售_求购_买卖_交易

钻瓜专利网为您找到相关结果198个，建议您升级VIP下载更多相关专利

[发明专利]基于语音情绪识别的客户满意度分析方法及装置-CN202210977237.X在审
发明人：徐伟;王文生;陈勇;高琴;鲁惟翔;苏醒;林儿;陈巧俊;谢文杰;傅一平 -专利权人：中国移动通信集团浙江有限公司;中国移动通信集团有限公司
申请日： 2022-08-15 - 公布日： 2023-10-27 - 主分类号： G10L25/24 文献下载
摘要：本发明实施例涉及移动通信技术领域，公开了一种基于语音情绪识别的客户满意度分析方法及装置，该方法包括：对待处理语音信号进行特征提取，获取所述待处理语音的语音情绪特征；根据所述语音情绪特征基于个体相关系数计算三维情绪识别量，并根据所述三维情绪识别量预估客户满意度；计算所述待处理语音信号的语音能量均值和节拍均值；根据预估的客户满意度、所述语音能量均值以及所述节拍均值进行客户满意度总体评价。通过上述方式，本发明实施例能够更加客观的反映客户对电话客服的服务满意度，有利于电话客服和客户建立良好的长久的关系，促进企业长期利益的实现。
基于语音情绪识别客户满意分析方法装置

[发明专利]基于说话人特征的鉴伪模型训练方法-CN202310931489.3在审
发明人：陈庭威;唐帅;吴凌翔;王金桥 -专利权人：武汉人工智能研究院;中国科学院自动化研究所
申请日： 2023-07-25 - 公布日： 2023-10-27 - 主分类号： G10L25/24 文献下载
摘要：本发明公开了一种基于说话人特征的鉴伪模型训练方法，包括以下步骤，S1、提取输入音频中的第一特征与第二特征；S2、将第一特征输入说话人特征提取网络，得到说话人特征；将第二特征输入鉴伪特征提取网络，得到鉴伪特征；S3、将说话人特征和鉴伪特征进行概率加权得到融合特征；S4、将融合特征输入分类器以得到输入音频的真伪结果；S5、建立损失函数，重复步骤S1～S4，以对鉴伪模型进行迭代训练；并且在训练过程中冻结说话人提取网络的所有权重，而仅更新鉴伪特征提取网络的权重。该方法生成的鉴伪模型具有良好的鲁棒性和泛化性，且标注成本低。
基于说话特征模型训练方法

[发明专利]语音风格迁移模型的训练方法、装置、设备及存储介质-CN202110192901.5有效
发明人：孙奥兰;王健宗;程宁 -专利权人：平安科技（深圳）有限公司
申请日： 2021-02-20 - 公布日： 2023-10-17 - 主分类号： G10L25/24 文献下载
摘要：本申请涉及人工智能技术领域，公开了一种语音风格迁移模型的训练方法、装置、设备及存储介质，该方法包括：通过基于预置神经网络模型，根据第一梅尔语谱信息和第二梅尔语谱信息得到第一更新参数；将第一梅尔语谱信息和第二梅尔语谱信息输入到预置分类器，得到对应第一风格奖励参数；通过第二梅尔语谱信息确定第一内容奖励参数；根据第一风格奖励参数和第一内容奖励参数，获取第二更新参数；通过第一更新参数和第二更新参数对预置神经网络模型的模型参数进行更新生成对应的语音风格迁移模型，实现音频到音频的风格迁移，且分类器可以实现细粒度的风格迁移，还从风格奖励和内容奖励两个维度完成源音频到目标音频的转换，无需收集大量目标音频语料。
语音风格迁移模型训练方法装置设备存储介质

[发明专利]一种虚拟音色转换方法、装置、系统及存储介质-CN202310968082.8在审
发明人：郭丹丹 -专利权人：平安银行股份有限公司
申请日： 2023-07-31 - 公布日： 2023-10-13 - 主分类号： G10L25/24 文献下载
摘要：本发明提供了一种虚拟音色转换方法、装置、系统及存储介质，涉及金融科技技术领域。所述虚拟音色转换方法包括：基于目标音色向客户端推送服务应答信息；根据人工客服转接指令连接对应人工客服端；获取交互语音数据实时进行转换，得到与交互语音数据对应的转换语音数据；将转换语音数据推送至所述客户端。本发明的虚拟音色转换方法能够保留说话人的语速语调语音内容，对于实时对话场景仅进行音色迁移，不需将语音转成文本，再将文本转换为语音，缩短了转换时长且提升响应速度；将人工客服和AI外呼机器人音色统一，做到无感人机切换，大大提升客户体验。
一种虚拟音色转换方法装置系统存储介质

[发明专利]基于CFCC特征的鲁棒音频复制粘贴篡改检测方法及装置-CN202310972171.X在审
发明人：史沧红;王冬宇;李孝杰;李俊容;牛宪华;熊玲;陈荣 -专利权人：西华大学
申请日： 2023-08-03 - 公布日： 2023-10-13 - 主分类号： G10L25/24 文献下载
摘要：本发明公开基于CFCC特征的鲁棒音频复制粘贴篡改检测方法及装置，涉及数字音频信号处理技术领域，拟解决现有技术在检测经过后处理的复制移动音频信号时，检测精度不高的问题；本发明包括S1：通过语音检测活动区分语音信号中的有声段和无声段；S2：提取每个有声段的耳蜗倒谱系数特征；S3：利用皮尔逊相关系数比较每个有声段耳蜗倒谱系数特征之间的相似度；本发明在低信噪比的情况下具有更高的检测精度，进而具有更好的鲁棒性。
基于 cfcc 特征音频复制粘贴篡改检测方法装置

[发明专利]融合频带自向下注意力机制的电厂设备状态听觉监测方法-CN202211214042.6在审
发明人：陈满;姚建超;赵增涛;张晖;陈弘昊;张豪;窦博文;李重阳;林伟杰;郑春;叶超欣;黄璐琦;吴盛彪;徐添;何健辉 -专利权人：南方电网调峰调频发电有限公司储能科研院
申请日： 2022-09-30 - 公布日： 2023-09-29 - 主分类号： G10L25/24 文献下载
摘要：本发明公开了融合频带自向下注意力机制的电厂设备状态听觉监测方法。所述方法包括以下步骤：设置声音传感器，获取电气设备运行的声音；对电气设备运行的声音进行预处理，得到预处理后的声音数据；对预处理后的声音数据进行频带自向下注意力机制处理；进行卷积神经网络识别，得到识别结果。本发明提出的方法解决了传统声音监测方法需要深度挖掘不同电气设备运行状态声音特征从而导致难度大、效率低的问题；本发明提出的方法解决了机器学习方法直接套用从而导致样本需求大、训练次数多的问题；本发明提出的新的频带自向下注意力机制，结合电气设备运行声音的特点，对梅尔频谱图中集中向下蔓延的区域惊醒关注，识别效果更好，训练次数更少。
融合频带向下注意力机制电厂设备状态听觉监测方法

[发明专利]音色模板定制方法及其装置、设备、介质、产品-CN202111092287.1有效
发明人：黄杰雄 -专利权人：广州酷狗计算机科技有限公司
申请日： 2021-09-17 - 公布日： 2023-09-22 - 主分类号： G10L25/24 文献下载
摘要：本申请公开音色模板定制方法及其装置、设备、介质、产品，所述方法包括：获取音频采样数据，从中提取出人声发音部分相对应的梅尔频谱信息；调用预训练至收敛状态的音色提取模型从所述梅尔频谱信息中提取出表征该音频采样数据的音源对象的音色的向量矩阵集，该向量矩阵集包括时域上的多个向量矩阵；求取所述向量矩阵集中多个向量矩阵之间的均值向量矩阵作为该音源对象的声纹特征信息；生成所述音源对象相对应的音色模板，所述音色模板包括音源对象的命名标识及由该命名标识所指向的所述声纹特征信息。本申请能够从音频数据中有效地综合并抽象出表征音源对象的音色的声纹特征信息，有助于辅助音乐创作。
音色模板定制方法及其装置设备介质产品

[发明专利]一种音频文件的声场分析方法及装置-CN202210879403.2有效
发明人：夏妍;林锋 -专利权人：镁佳(北京)科技有限公司
申请日： 2022-07-25 - 公布日： 2023-09-19 - 主分类号： G10L25/24 文献下载
摘要：本发明提供了一种音频文件的声场分析方法及装置，其中，音频文件的声场分析方法包括：获取待识别音频文件；将待识别音频文件划分为若干音频数据，并对每一音频数据进行合成器含量计算，得到合成器含量计算结果；对待识别音频文件进行伴奏人声比计算，得到伴奏人声比计算结果；判断合成器含量计算结果是否满足合成器含量阈值，以及伴奏人声比计算结果是否满足伴奏人声比阈值；当合成器含量计算结果、伴奏人声比计算结果分别满足各自阈值时，判定待识别音频文件的声场属性为声场窄。在准确计算得到合成器含量以及伴奏人声比的同时，还可以将音频文件的空间感进行有效表征，进而通过音频文件的内在属性对音频文件的调节进行准确指导。
一种音频文件声场分析方法装置

[发明专利]一种机车风机故障检测方法及装置-CN202310768392.5在审
发明人：孟宪国;杨国志;孙泽君;李哲;孙飚;焦杨;丁颖 -专利权人：国能铁路装备有限责任公司
申请日： 2023-06-27 - 公布日： 2023-09-12 - 主分类号： G10L25/24 文献下载
摘要：本申请提供的一种机车风机故障检测方法及装置，方法包括：获取待测机车风机的实时音频信息；从所述实时音频信息汇总提取梅尔顿频率倒谱系数；将所述梅尔顿频率倒谱系数输入预训练的高斯混合模型，得到对应的相似度评分；根据所述相似度评分与预先设定的相似度阈值，确定所述待测机车风机的检测结果；若所述待测机车风机的检测结果为所述存在具体故障类别，则基于所述相似度评分，与具体故障类别进行匹配，输出具体故障类别名称。从而能够在机车运行的复杂环境下，通过音频诊断算法对实时音频信息进行提取和识别，得到对应的检测结果。
一种机车风机故障检测方法装置

[发明专利]音频接收端的啸叫检测方法、系统、解码方法及解码器-CN202310769132.X在审
发明人：李强;王尧;叶东翔;朱勇 -专利权人：百瑞互联集成电路（上海）有限公司
申请日： 2023-06-27 - 公布日： 2023-09-12 - 主分类号： G10L25/24 文献下载
摘要：本申请公开了一种音频接收端的啸叫检测方法、系统、解码方法及解码器，属于蓝牙音频技术领域。该方法包括：在音频解码过程中确定音频帧的第一谱系数；根据第一谱系数计算倒谱系数，并对倒谱系数进行优化；将优化后的倒谱系数变换得到第二谱系数，并根据第二谱系数进行啸叫检测。本申请在根据谱系数进行啸叫检测之前，首先根据谱系数进行倒谱系数的计算，然后对倒谱系数进行优化，避免其他因素对啸叫检测产生影响，然后将优化后的倒谱系数转换得到谱系数，再进行啸叫检测，提高啸叫检测的准确性。
音频接收检测方法系统解码解码器

[发明专利]音频生成方法、声码器、电子设备及存储介质-CN202310923000.8在审
发明人：张斌 -专利权人：腾讯音乐娱乐科技（深圳）有限公司
申请日： 2023-07-25 - 公布日： 2023-09-05 - 主分类号： G10L25/24 文献下载
摘要：本申请公开一种音频生成方法、声码器、电子设备及存储介质。音频生成方法由神经网络型声码器实施，该音频生成方法包括：获取待生成音频的梅尔谱图；将所述梅尔谱图输入神经网络型声码器，其中所述神经网络型声码器包括基频提取模块、波发生模块和生成器网络模块；由所述基频提取模块从所述梅尔谱图中提取多个音频帧的基频音调值，由所述波发生模块将多个所述基频音调值对应的周期性波信号进行融合得到融合声源信号，由所述生成器网络模块利用融合声源信号和梅尔谱图生成目标音频。根据本申请实施例，能够提高音频音质和自然度。
音频生成方法声码电子设备存储介质

[发明专利]端到端提取BNF特征的方法、网络模型、训练方法及系统-CN202111443128.1有效
发明人：司马华鹏;毛志强;孙雨泽 -专利权人：南京硅基智能科技有限公司
申请日： 2021-11-30 - 公布日： 2023-09-05 - 主分类号： G10L25/24 文献下载
摘要：本申请公开一种端到端提取BNF特征的方法、网络模型、训练方法及系统，其中，网络模型包括循环网络模块和编码模块：所述循环网络模块，用于输入源说话人音频的梅尔频率倒谱系数特征，输出下采样特征；所述编码模块，用于输入所述下采样特征，基于自注意力算法和深度卷积学习，得到第一特征，以及对所述第一特征全连接处理，输出所述源说话人音频的BNF特征，其中，所述第一特征包括所述源说话人音频的帧与帧之间的全局依赖关系和局部依赖关系。本申请的网络模型，可以实现端到端提取BNF特征，时效性更佳，不会叠加中间误差，从而保证提取的BNF特征的准确性。
端到端提取 bnf 特征方法网络模型训练系统

[发明专利]性别识别模型处理方法、装置、计算机设备及存储介质-CN202310368697.7在审
发明人：陶民泽 -专利权人：平安健康保险股份有限公司
申请日： 2023-04-06 - 公布日： 2023-08-22 - 主分类号： G10L25/24 文献下载
摘要：本申请实施例属于人工智能领域，涉及一种性别识别模型处理方法、装置、计算机设备及存储介质，方法包括：获取带有性别标签的训练语音，获取其基频参数和梅尔频率复合特征，梅尔频率复合特征包括梅尔频率倒谱系数及其对应的一阶差分参数和二阶差分参数；将基频参数和梅尔频率复合特征输入初始性别识别模型，得到预测性别；基于基频参数确定假设性别，并根据性别标签、假设性别和预测性别所构成的性别组合类型计算模型损失，以根据模型损失调整模型，直至训练停止得到性别识别模型；将待识别用户的用户语音输入性别识别模型，得到性别识别结果。本申请还涉及区块链技术，训练语音可存储于区块链中。本申请提高了性别识别的准确性。
性别识别模型处理方法装置计算机设备存储介质

[发明专利]基于自注意力的音频美化方法、装置、设备及存储介质-CN202310614023.0在审
发明人：张旭龙;王健宗;程宁;季圣鹏 -专利权人：平安科技（深圳）有限公司
申请日： 2023-05-26 - 公布日： 2023-08-18 - 主分类号： G10L25/24 文献下载
摘要：本发明公开了一种基于自注意力的音频美化方法，该方法包括获取待处理音频；获取音频模型，对所有待处理音频进行内容提取，得到音频内容；对所有待处理音频进行音色提取，得到音频音色；对所有所述待处理音频进行能量提取，得到音频能量；将音频内容、音频音色和音频能量进行连接，得到音频特征；通过音频模型编码端对音频特征进行编码处理，得到编码特征；获取标准音频特征以及音频音高，通过音频模型解码端对标准音频特征、编码特征以及音频音高进行解码，得到美化音频。本发明通过在训练过程中采用训练加测试，使得整体的模型具有轻量化。通过引入位置嵌入和注意力机制，提高了模型的鲁棒性。引入能量特征并隐形表示，改善了音频质量。
基于注意力音频美化方法装置设备存储介质

[发明专利]音效设置方法、装置、设备以及计算机可读存储介质-CN202110945754.4有效
发明人：包静;曾轶 -专利权人：咪咕音乐有限公司;咪咕文化科技有限公司;中国移动通信集团有限公司
申请日： 2021-08-17 - 公布日： 2023-08-18 - 主分类号： G10L25/24 文献下载
摘要：本发明公开了一种音效设置方法、装置、设备以及计算机可读存储介质，所述方法包括：获取用户的目标音频，提取所述目标音频的音频特征参数，所述目标音频包括用户播放的歌曲的音频或者所述用户所在的环境音频；将所述音频特征参数输入预设的音效设置模型，所述音效设置模型由用户的历史音频训练得到；获取所述音效设置模型输出的各个预设音效的概率值，根据所述概率值在所述预设音效中选取所述目标音频对应的目标音效，以按照所述目标音效播放音频数据或者视频数据。本发明提高了用户的听歌体验。
音效设置方法装置设备以及计算机可读存储介质

1
2
3
4
5
6
7
8
9
10
11
12
13
14
下一页»
尾页
共 198 条