“语音样本”专利关键词查询_检索下载_查询列表_检索列表_行业专利分布_钻瓜专利网

钻瓜专利网为您找到相关结果362750个，建议您升级VIP下载更多相关专利

[发明专利]基于生成对抗网络的短语音样本补偿方法及存储介质-CN201911067181.9在审
发明人：胡章芳;付亚芹 -专利权人：重庆邮电大学
申请日： 2019-11-04 - 公布日： 2020-12-25 - 主分类号： G10L15/06 文献下载
摘要：本发明请求保护一种基于生成对抗网络的短语音样本补偿方法及存储介质。该方法用于解决说话人识别系统中短语音情况造成的语料数据不充分，进而导致识别率严重降低的问题。它假设长语音分布中含有充分的区分说话人身份信息的特征，从长语音中提取能区分说话人身份的特征作为生成器G和判别器D的条件输入。把短语音作为生成器G的输入，生成器G试图在条件信息的辅助下把短语音补偿成接近真实长语音分布的样本，而鉴别器D试图确定给定的语音是真实的长语音样本还是由生成器补偿的伪语音。本发明完成了短语音样本到补偿语音样本的映射，在使补偿后的语音含有充分声学特征的同时还增加了训练样本的通用性和多样性，从而提高系统鲁棒性，降低说话人识别等错误率。
基于生成对抗网络语音样本补偿方法存储介质

[发明专利]唤醒程度识别模型训练方法及语音唤醒程度获取方法-CN202110462278.0在审
发明人：邵池;黄东延 -专利权人：深圳市优必选科技股份有限公司
申请日： 2021-04-27 - 公布日： 2021-07-30 - 主分类号： G10L25/63 文献下载
摘要：本申请实施例提供了一种唤醒程度识别模型训练方法及语音唤醒程度获取方法，其中方法包括：获取样本语音的唤醒程度标签，并根据所述样本语音的唤醒程度标签对部分所述样本语音进行数据增强；提取所述样本语音对应帧序列的特征矩阵通过所提供的唤醒程度识别模型训练方案，针对不同唤醒程度的样本语音进行特征提取，并输入到神经网络中进行训练，这样即可得到能够识别语音唤醒程度的唤醒程度识别模型。将唤醒程度识别模型应用于语音识别场景，在基础语音识别的基础上增加唤醒程度的识别，增强语音识别的准确性和多样性。
唤醒程度识别模型训练方法语音获取

[发明专利]一种语音识别方法、装置、设备、存储介质及产品-CN202310218960.4在审
发明人：徐延广;马东鹏;项伟 -专利权人：百果园技术（新加坡）有限公司
申请日： 2023-03-07 - 公布日： 2023-06-06 - 主分类号： G10L15/06 文献下载
摘要：本申请实施例提供了一种语音识别方法、装置、设备、存储介质及产品。本申请实施例提供的技术方案通过利用语音识别模型对待处理语音信息进行分析处理，得到待处理语音信息的识别结果，该语音识别模型为基于过滤处理以及分布平衡处理后的无标注样本音频以及有标注样本音频进行半监督训练得到，语音识别模型，过滤处理以及分布平衡处理后的无标注样本音频分布情况更容易拟合正确标注的音频的分布情况，充分利用无标注音频样本进行语音识别模型的半监督训练，减少人工标注的人力和时间成本，减少大量的无标注样本音频对训练效率和语音识别模型识别准确度的影响，有效提升语音识别模型的训练效率以及语音识别效果。
一种语音识别方法装置设备存储介质产品

[发明专利]语音识别模型训练方法、系统、移动终端及存储介质-CN201911231249.2有效
发明人：徐敏;肖龙源;李稀敏;蔡振华;刘晓葳 -专利权人：厦门快商通科技股份有限公司
申请日： 2019-12-05 - 公布日： 2022-10-28 - 主分类号： G10L15/06 文献下载
摘要：本发明提供了一种语音识别模型训练方法、系统、移动终端及存储介质，该方法包括：获取样本语音及样本文本，对样本语音进行特征提取，以得到语音特征；分别对语音特征和样本文本进行向量变换，根据向量变换结果对应进行编码计算和矩阵计算，以得到语音编码结果和文本矩阵；对文本矩阵进行归一化处理，以得到概率向量，根据概率向量和样本文本进行损失计算，以得到模型总损失；在语音识别模型中将模型总损失进行传播，同时对语音识别模型进行参数更新，直至语音识别模型收敛本发明无需进行发音词典的构建，降低了人力成本和模型训练的时间，通过采用端到端架构，使得所有参数同时进行更新，提高了模型训练效率和后续语音识别的效率。
语音识别模型训练方法系统移动终端存储介质

[发明专利]一种基于语音提取的模型训练方法、装置及设备-CN202111032300.4在审
发明人：尹首一;史慧宇;韩慧明;刘雷波;魏少军 -专利权人：清华大学
申请日： 2021-09-03 - 公布日： 2021-12-07 - 主分类号： G10L15/06 文献下载
摘要：本说明书实施例提供一种基于语音提取的模型训练方法、装置及设备。所述方法包括：获取混合语音样本数据；所述混合语音样本数据为单通道语音信号；所述混合语音样本数据中包括噪声信号、干扰语音信号、混响信号中的至少一种和目标语音信号；构建初始语音提取模型；所述初始语音提取模型包括基于深度神经网络所构建的模型；将所述混合语音样本数据输入所述初始语音提取模型得到预测目标语音；基于所述预测目标语音和预设损失函数对所述初始语音提取模型进行优化，得到语音提取模型；所述语音提取模型用于对单通道语音信号中的目标语音信号进行提取上述方法准确有效地从单通道语音中进行了语音提取，满足了后续语音处理的相关需求。
一种基于语音提取模型训练方法装置设备

[发明专利]一种基于人工智能的语音增强方法-CN202310934524.7有效
发明人：黄碧娣 -专利权人：合肥朗永智能科技有限公司
申请日： 2023-07-28 - 公布日： 2023-10-03 - 主分类号： G10L21/0232 文献下载
摘要：本发明涉及语音增强技术领域，公开了一种基于人工智能的语音增强方法，获取纯净语音样本和噪声语音样本，将纯净语音样本和噪声语音样本经过短时傅里叶变换分别得到纯净语音幅度谱和带噪语音幅度谱；分别对纯净语音幅度谱和带噪语音幅度谱进行第一特征提取，得到纯净语音特征和带噪语音特征；将纯净语音特征和带噪语音特征输入神经网络模型中进行训练，得到语音增强模型；获取含噪的待增强语音，对待增强语音进行第二特征提取，得到噪声测试集；将噪声测试集输入语音增强模型中，进行波形重构，并基于含噪的待增强语音的混合相位，得到目标增强语音；本发明达到降噪的效果，有效提升用户体验，同时提高了语音的可懂度及识别准确度。
一种基于人工智能语音增强方法

[发明专利]语音合成、语音合成模型训练方法、装置及设备-CN202011613599.8在审
发明人：丁雪枫 -专利权人：大众问问（北京）信息科技有限公司
申请日： 2020-12-30 - 公布日： 2022-07-01 - 主分类号： G10L13/02 文献下载
摘要：本发明实施例公开了一种语音合成、语音合成模型训练方法、装置及设备。其中，语音合成模型训练方法，包括：对音频数据样本进行预处理，得到音频数据样本对应的目标音素训练样本和目标频谱训练样本；通过目标音素训练样本对第一初始模型进行训练，得到音素转换模型；通过目标频谱训练样本对第二初始模型进行训练，得到频谱转换模型；将音素转换模型和频谱转换模型，组合构成语音合成模型。本发明实施例的技术方案，通过双模型进行语音合成，优化离线语音合成效果的同时，降低计算资源消耗。
语音合成模型训练方法装置设备

[发明专利]一种构建语料库的方法、装置、计算设备及存储介质-CN201911219713.6有效
发明人：高杰 -专利权人：珠海格力电器股份有限公司
申请日： 2019-12-03 - 公布日： 2021-08-27 - 主分类号： G06F16/683 文献下载
摘要：所述方法包括：获取样本语音资源，以及获取样本噪声资源；确定所述样本语音资源对应的语音音频特征向量，以及确定所述样本噪声资源对应的噪声音频特征向量；根据所述语音音频特征向量和所述噪声音频特征向量，按照预设合成规则将所述样本噪声资源和所述样本语音资源进行合成
一种构建语料库方法装置计算设备存储介质

[发明专利]语音标注质量评价方法、装置、电子设备与存储介质-CN202210457751.0在审
发明人：杨军;方磊;施志强;方四安;柳林;何智磊 -专利权人：合肥讯飞数码科技有限公司
申请日： 2022-04-27 - 公布日： 2022-07-29 - 主分类号： G10L15/06 文献下载
摘要：本发明提供一种语音标注质量评价方法、装置、电子设备与存储介质，其中方法包括：确定样本语音的标注文本；基于所述标注文本进行语音合成，得到合成语音；基于所述样本语音和所述合成语音分别对应的声学特征，确定所述样本语音与所述合成语音之间的声学相似度本发明提供的方法、装置、电子设备与存储介质，通过根据样本语音和合成语音分别提取得到的声学特征，确定样本语音与合成语音之间的声学相似度，再根据声学相似度确定标注质量评价结果，从而可以实现标注文本的准确质量评价
语音标注质量评价方法装置电子设备存储介质

[发明专利]声纹识别模型的训练及声纹识别方法、系统、设备和介质-CN202210633977.1在审
发明人：任君;罗超;王清;邹宇 -专利权人：携程旅游信息技术（上海）有限公司
申请日： 2022-06-06 - 公布日： 2022-07-29 - 主分类号： G10L17/02 文献下载
摘要：本发明公开了一种声纹识别模型的训练及声纹识别方法、系统、设备和介质，该训练方法包括获取若干样本语音，提取样本语音的每个语音帧对应的声学频谱特征，获取声学频谱特征对应的设定数量维度的目标帧特征，基于目标帧特征处理得到样本语音对应的目标语音特征，基于目标语音特征获取样本语音对应的声纹向量，将同一样本语音对应的声学频谱特征作为输入，对应的声纹向量作为输出，训练得到声纹识别模型；实现了有针对性的提取语音中的声纹信息，对语音中每个语音帧的各个维度进行评估，计算语音帧的维度权重，以选择出重要的声纹信息，减少了声纹识别模型的参数量和计算量，加快了模型的推理时间，提高了模型声纹信息的提取精度和准确率。
声纹识别模型训练方法系统设备介质

[发明专利]语音识别模型的生成方法、语音识别方法、装置及设备-CN202210048877.2在审
发明人：陈勇;王浪 -专利权人：珠海金山办公软件有限公司;北京金山办公软件股份有限公司;武汉金山办公软件有限公司
申请日： 2022-01-17 - 公布日： 2023-07-25 - 主分类号： G10L15/06 文献下载
摘要：本申请公开了一种语音识别模型的生成方法、语音识别方法、装置及设备，涉及语音识别技术领域，生成的语音识别模型能够准确提取到较强表征能力的语音特征向量，提高语音识别用户身份的准确率。其中方法包括：获取多元语音样本数据组合；通过孪生神经网络的特征提取模块，对多元语音样本数据组合进行特征提取，得到表征不同样本类型的语音特征向量，通过孪生神经网络的相似计算模块，确定表征不同样本类型的语音特征向量之间的相似度，根据表征不同样本类型的语音特征向量之间的相似度对孪生神经网络进行训练，得到训练后的孪生神经网络，使用训练后的孪生神经网络的特征提取模块构建语音识别模型。
语音识别模型生成方法装置设备

[发明专利]虚拟语音的生成方法、装置、存储介质及电子装置-CN202211676955.X在审
发明人：郁祖达;孙见青;梁家恩 -专利权人：云知声智能科技股份有限公司
申请日： 2022-12-26 - 公布日： 2023-04-18 - 主分类号： G10L13/02 文献下载
摘要：本发明公开了一种虚拟语音的生成方法、装置、存储介质及电子装置。其中，该虚拟语音的生成方法包括：通过获取多个不同的语音文本样本及语音属性信息，多个不同的语种语音文本样本中的每个语音文本样本对应一个语种，一个对象；将每个语音文本样本输入多流编码器中，得到每个语音文本样本对应的文本特征；通过文本特征以及语音特征训练基于生成式对抗网络建模的预设语音声学模型，得到生成虚拟语音的目标声学模型，即本发明可支持跨语种数据训练及跨语种发音人的生成，多流编码器能更好的捕捉不同语种中的文本特征，提升虚拟预设生成的灵活性以及可靠性，进而解决了现有技术中，生成虚拟语音的灵活性以及可靠性较低的技术问题。
虚拟语音生成方法装置存储介质电子

[发明专利]一种基于复杂不变性语音信号数据集相似性度量方法-CN202211374049.4在审
发明人：朱明 -专利权人：深圳市赫墨斯科技有限公司
申请日： 2022-11-03 - 公布日： 2023-03-28 - 主分类号： G10L13/027 文献下载
摘要：本发明公开了一种基于复杂不变性语音信号数据集相似性度量方法，该方法包括下述步骤，S1.输入参与相似性比对的两个语音信号数据集，将两个语音信号数据集按照完整句子划分为多个语音样本；S2.分别从两个语音信号数据集中各选出一个语音样本构成语音样本对；S3.计算语音样本对的复杂不变距离；S4.取所有语音样本对复杂不变距离的最小值作为两个语音信号数据集之间的相似性度量。本发明提供了一种基于复杂不变性的语音信号数据集相似性度量方法，用于指导语音信号合成过程中的源数据集选择。
一种基于复杂不变性语音信号数据相似性度量方法

[发明专利]声纹模型的训练方法、装置、设备、介质及产品-CN202310430328.6在审
发明人：徐雪萍;原道德;刘进涛;葛新;杨凯 -专利权人：中国建设银行股份有限公司;建信金融科技有限责任公司
申请日： 2023-04-20 - 公布日： 2023-07-18 - 主分类号： G10L15/06 文献下载
摘要：该方法包括：获取多个样本数据；在第一声纹模型的第i次迭代训练中，随机生成一个在预设长度范围内的样本长度，并按照样本长度对第i次迭代训练所输入的各样本语音数据进行切分，以获得各样本语音数据对应的多个长度为样本长度的样本语音块；以各样本语音数据对应的样本说话人标识为监督数据，基于各样本语音数据对应的多个样本语音块对第一声纹模型进行第i次迭代训练；若训练后的第一声纹模型满足预设收敛条件，则将满足预设收敛条件的第一声纹模型确定为训练完成的第一声纹模型
声纹模型训练方法装置设备介质产品

[发明专利]一种去混响模型训练方法及装置-CN201910346319.2在审
发明人：肖龙帅;杨占磊 -专利权人：华为技术有限公司
申请日： 2019-04-26 - 公布日： 2020-10-30 - 主分类号： G10L15/06 文献下载
摘要：本申请公开了人工智能技术领域中的一种去混响模型训练方法及装置，其中去混响模型训练方法包括：将语音对样本中的混响语音样本输入到第一去混响模型进行处理，得到所述混响语音样本对应的去混响语音；将所述混响语音样本对应的去混响语音输入到声学模型，得到所述声学模型输出的第一输出结果；将所述语音对样本中的纯净语音样本输入到所述声学模型，得到所述声学模型输出的第二输出结果；计算所述第一输出结果和所述第二输出结果的误差，根据所述误差对所述第一去混响模型的参数进行调整用以避免对已有声学模型产生影响，提高训练得到的去混响模型与声学模型的匹配度，进而提高混响语音识别的准确性。
一种混响模型训练方法装置