“语音训练”专利关键词查询_检索下载_查询列表_检索列表_行业专利分布_钻瓜专利网

钻瓜专利网为您找到相关结果507363个，建议您升级VIP下载更多相关专利

[发明专利]一种中英文混合语音识别方法及装置-CN201910780880.1有效
发明人：张广学;肖龙源;蔡振华;李稀敏;刘晓葳;王静 -专利权人：厦门快商通科技股份有限公司
申请日： 2019-08-22 - 公布日： 2022-10-28 - 主分类号： G10L15/00 文献下载
摘要：本发明公开一种中英文混合语音识别方法及装置，属于语音识别技术领域，该方法包括，获取中英文混合词典，该中英文混合词典包括：训练文本，基于“汉字‑拼音”和“拼音‑音素”的结构，对训练文本中的英文表达、中英文表达生成音素规则；将中英文混合词典作为训练词典，进行语言模型训练，得到训练后的语言模型，训练语料，对语料提取语音特征，基于语音特征采用时延神经网络进行声学模型训练，得到训练后的声学模型；结合训练后的声学模型和训练后的语言模型对中英文混合语音进行语音识别本发明避免对每个国际音标建立一个音素，解决了语音模型庞大、解码速度慢的问题，提高了中英文混合语音的识别正确率。
一种中英文混合语音识别方法装置

[发明专利]语音合成模型的训练方法、语音合成方法及相关设备-CN202210438654.7在审
发明人：刘鹏飞;王洪斌;刘敏 -专利权人：马上消费金融股份有限公司
申请日： 2022-04-25 - 公布日： 2022-08-02 - 主分类号： G10L13/02 文献下载
摘要：本申请实施例公开了一种语音合成模型的训练及其语音合成方法、装置及电子设备，该方法包括：获取训练样本数据对以及语音合成模型，所述语音合成模型包括音素处理模块和文本处理模块；通过所述音素处理模块中的音素特征提取模块对所述音素数据进行特征提取得到音素特征，以及通过所述文本处理模块对所述训练文本进行特征提取，得到文本特征；通过所述文本处理模块将所述音素特征和所述文本特征进行融合，并通过所述语音合成模块基于融合得到的特征进行语音合成处理，得到所述训练文本对应的训练语音；基于所述训练文本对应的训练语音和所述训练文本对应的合成语音标签，对所述语音合成模型进行训练。
语音合成模型训练方法相关设备

[发明专利]一种合成不同情感音频的方法和装置-CN202211454821.3在审
发明人：周琳岷;王昆;朱海 -专利权人：四川启睿克科技有限公司;四川长虹电子控股集团有限公司
申请日： 2022-11-21 - 公布日： 2023-03-07 - 主分类号： G10L13/02 文献下载
摘要：本发明提供了一种合成不同情感音频的方法和装置，包括了训练阶段和推理阶段，在训练阶段包括以下步骤：S11、采集训练语料，包括不同说话人的音频及对应的文本，以及情感标签并提取对应语音的频谱特征；S12、根据的语音频谱特征以及对应的情感标签，训练情感语音特征提取模型；S13、提取训练语料的情感特征向量和对应训练语料的文本编码向量；S14、将文本编码向量结合语音的情感特征向量，通过对应语音的声学特征训练语音合成模型；S15、语音的情感特征向量和文本编码向量作为输入，训练情感特征预测模型；S16、通过语音的声学特征与对应语音训练声码器；本发明解决了传统语音合成语气平淡，情感不清晰的问题。
一种合成不同情感音频方法装置

[发明专利]语音识别方法、语音识别模型的训练方法、装置及设备-CN202310591618.9在审
发明人：易澄 -专利权人：北京达佳互联信息技术有限公司
申请日： 2023-05-23 - 公布日： 2023-09-12 - 主分类号： G10L15/06 文献下载
摘要：本公开关于一种语音识别方法、语音识别模型的训练方法、装置及设备，该方法包括：获取样本音频以及样本音频中的第一样本音频对应的标注文本；基于第一样本音频和标注文本，对初始语音识别模型进行联合预训练，得到第一语音识别模型；基于样本音频对第一语音识别模型进行参数调整训练，得到训练好的语音识别模型。本公开实施例仅用部分样本音频对应的标注文本作为模型中间层的监督信号进行监督预训练，并同时对语音识别模型进行自监督预训练，此种联合预训练帮助模型同时学习到不同维度的发音特征，使得模型在正式训练中更快更好地学习音频特征，提升了语音识别模型的训练效率，并且提升了语音识别模型在应用侧语音识别的准确性。
语音识别方法模型训练装置设备

[发明专利]语音合成模型生成方法和装置-CN201710897311.6有效
发明人：李昊 -专利权人：百度在线网络技术（北京）有限公司
申请日： 2017-09-28 - 公布日： 2021-03-19 - 主分类号： G10L13/00 文献下载
摘要：本申请公开了语音合成模型生成方法和装置。该方法的一具体实施方式包括：获取用于对语音合成模型对应的神经网络进行训练的文本的文本特征和文本对应的语音的声学特征，其中，声学特征中的用于训练的文本对应的语音的基频数据通过基频数据提取模型提取，基频数据提取模型基于利用包含的每一帧语音均对应有基频数据的语音预先对基频数据提取模型对应的神经网络进行训练而生成；利用文本特征和声学特征对语音合成模型对应的神经网络进行训练。实现了利用预先训练的基频数据提取模型提取用于训练的段语音的基频数据，使得用于训练语音的完整的基频数据可以用于对语音合成模型对应的神经网络的训练，进而提升训练效果。
语音合成模型生成方法装置

[发明专利]语音分类模型的训练方法、语音分类方法及相关装置-CN202110762453.8在审
发明人：张军伟;李诚 -专利权人：上海商汤智能科技有限公司
申请日： 2021-07-06 - 公布日： 2021-10-22 - 主分类号： G10L15/02 文献下载
摘要：本申请公开语音分类模型的训练方法、语音分类方法及相关装置、设备、存储介质，其中，训练方法包括：获取至少一个类别的语音数据，同一类别的语音数据构成一个语音数据集；提取语音数据集中每个语音数据的语音特征；利用语音数据集中的语音特征对语音分类模型中的子分类模型进行训练；语音分类模型包括至少一个子分类模型，子分类模型与语音数据集一一对应。通过对语音数据进行类别分类，形成对应语音数据集，利用语音特征训练对应的子分类模型，从而得到识别所需类别语音数据的语音分类模型。本申请仅利用新类别的语音数据来进行训练，即可使得语音分类模型实现对新类别的分类。
语音分类模型训练方法相关装置

[发明专利]语音识别模型训练方法、装置和相关设备-CN202310620477.9在审
发明人：付立;李思琪;范璐 -专利权人：京东科技信息技术有限公司
申请日： 2023-05-29 - 公布日： 2023-08-04 - 主分类号： G10L15/06 文献下载
摘要：本公开提供一种语音识别模型训练方法、装置以及电子设备和计算机可读存储介质，涉及语音识别技术领域，上述语音识别模型训练方法可以包括：获取流式无标注语音、流式有标注语音、非流式无标注语音和非流式有标注语音；通过所述流式无标注语音和所述非流式无标注语音，对目标神经网络进行无监督训练，获得预训练模型；通过所述流式有标注语音和所述非流式有标注语音，对所述预训练模型进行参数微调，获得流式和非流式统一语音识别模型。通过本公开实施例提供的语音识别模型可以使得流式语音和非流式语音通过同一个语音识别模型进行识别，减少了模型训练过程和维护过程，提高了语音识别效率和准确率。
语音识别模型训练方法装置相关设备

[发明专利]一种语音合成与鉴伪评价的综合训练方法及装置-CN202211552858.X有效
发明人：郑榕;孟凡芹 -专利权人：北京远鉴信息技术有限公司
申请日： 2022-12-06 - 公布日： 2023-03-28 - 主分类号： G10L25/60 文献下载
摘要：本公开提供了一种语音合成与鉴伪评价的综合训练方法及装置，获取源语音以及目标语音作为输入语料；通过训练预设声音转换器进行语音转换；通过训练预设声音逆转换器进行语音逆转换；通过训练预设语音鉴伪器进行语音鉴伪；通过训练预设语音质量评估器进行语音质量评估；融合声音转换‑逆转换过程对应的语音转换损失函数、语音鉴伪器对应的语音鉴伪损失函数，以及语音质量评估器对应的质量评估损失函数构建目标损失函数进行最小化迭代。可以针对声音转换、语音评价、语音鉴伪检测三个任务进行综合训练优化，进而在提升语音的转换效果的同时，实现转换后声音的可检测性和可追溯性，对语音处理和声纹识别的潜在恶意攻击进行防御加固。
一种语音合成评价综合训练方法装置

[发明专利]一种基于语音交互控制的训练方法及存储介质-CN202110643034.2在审
发明人：王斌;谢志华 -专利权人：惠州市德赛西威汽车电子股份有限公司
申请日： 2021-06-09 - 公布日： 2021-09-28 - 主分类号： G10L15/06 文献下载
摘要：本发明涉及语音交互技术领域，提供一种基于语音交互控制的训练方法及存储介质，通过设置步骤S1～S4预置语音交互控制的自定义训练机制，在识别到语音训练指令时，进入训练教学模式，进行执行操作与语音指令的自定义设置；逐步地根据当前的界面信息执行用户输入的语音操作指令，直至完成本次训练(当识别到完成训练指令时)，此时将训练教学模式中的所有执行操作整合为目标指令操作集，并与自定义的阈值语音指令绑定导入语音指令数据库；如此即可根据用户的使用习惯自定义偏好的语音指令，脱离固定、死板的语音指令数据库的局限，使得语音交互控制设备更为灵活、智能且个性化。
一种基于语音交互控制训练方法存储介质

[发明专利]一种语音识别方法、装置、设备及存储介质-CN202211730260.5在审
发明人：张婷;李永超;马志强 -专利权人：科大讯飞股份有限公司
申请日： 2022-12-30 - 公布日： 2023-05-16 - 主分类号： G10L15/06 文献下载
摘要：本申请提供了语音识别方法、装置、设备及存储介质，具体实现方案为：将获取到的待识别语音数据输入至目标语音识别模型中，得到待识别语音数据对应的识别结果；其中，目标语音识别模型至少通过对初始语音识别模型进行第一训练得到，第一训练包括利用包含遮挡文本的文本训练数据对初始语音识别进行遮挡文本预测训练；第一训练将初始语音识别模型对文本训练数据中的遮挡文本的第一预测结果，与预先训练得到的语言模型对文本训练数据中的遮挡文本的第二预测结果相一致作为目标；语言模型基于预设知识库对文本训练数据进行扩展并利用扩展文本数据对文本训练数据中的遮挡文本进行预测。根据本申请的技术方案，能够提升语音数据的识别效果。
一种语音识别方法装置设备存储介质

[发明专利]多语种语音识别模型训练方法、装置、设备及存储介质-CN202010761691.2在审
发明人：郑振鹏;王健宗;罗剑;程宁 -专利权人：平安科技（深圳）有限公司
申请日： 2020-07-31 - 公布日： 2020-10-27 - 主分类号： G10L15/00 文献下载
摘要：本申请公开了一种多语种语音识别模型训练方法，涉及人工智能领域，所述方法通过第一语种对语音识别模型进行训练，得到初始语音识别模型；搭建自适应网络函数，并将自适应网络函数嵌入初始语音识别模型的隐藏层中，得到初始多语种语音识别模型；通过第二语种的语音数据对初始多语种语音识别模型进行模型训练，得到训练结果；对初始多语种语音识别模型进行迭代更新，直到训练结果落入预设标准训练结果范围内，输出多语种语音识别模型。此外，本申请还涉及区块链技术，本申请中的第一语种的语音数据、第二语种的语音数据可存储于区块链中。本申请在初始语音识别模型的隐藏层嵌入自适应网络函数，可以提高多语种语音识别模型训练的效率。
语种语音识别模型训练方法装置设备存储介质

[发明专利]一种语音转换方法及相关设备-CN202111362172.X在审
发明人：刘皓冬;李栋梁;刘恺 -专利权人：北京搜狗科技发展有限公司
申请日： 2021-11-17 - 公布日： 2022-02-18 - 主分类号： G10L17/04 文献下载
摘要：本申请涉及人工智能中的语音处理，在需要将任一源语音转换为具有指定的目标发声对象的目标音色和源语音内容的目标语音的场景下，对源语音进行语音识别，得到语音识别结果后，可以将该语音识别结果和目标发声对象的目标对象标识输入预训练的语音转换模型，由于该语音转换模型是将声学模型和声码器同步联合训练得到的，使得训练声码器的声学特征就是与其同步开始训练的声学模型输出的预测声学特征，从而保证了由此训练得到的声码器的语音合成效果，提高了声码器输出的目标语音的精准度根据需要，本申请还可能涉及区块链技术，预训练得到的语音转换模型及其训练过程产生的相关数据可以存储于区块链的节点。
一种语音转换方法相关设备

[发明专利]语音识别模型训练方法和语音识别联邦训练系统-CN202011561503.8有效
发明人：薛少飞 -专利权人：思必驰科技股份有限公司
申请日： 2020-12-25 - 公布日： 2022-07-08 - 主分类号： G10L15/06 文献下载
摘要：本发明公开一种语音识别模型训练方法，包括：基于通用语音识别样本集训练初始化通用语音识别模型；基于第一自适应语音识别样本集训练所述初始化通用语音识别模型得到第一用户语音识别模型；基于第一自适应语音识别样本集和第一声学环境信息训练第一用户语音合成模型；基于所述第一用户语音合成模型所生成的合成音频更新所述初始化通用语音识别模型得到新的通用语音识别模型，用于训练第二用户语音识别模型。本发明引入“语音合成模块”，通过它来记忆“通用/用户数据”的信息。通过引入声学环境信息，表征不同的说话人、噪声环境、语速等信息，可以增加模拟生成数据的泛化能力，提升训练效果，提高训练效率。
语音识别模型训练方法联邦系统

[发明专利]一种用于频带扩展算法的数据生成方法、系统及存储介质-CN202010933314.2在审
发明人：方泽煌;康元勋 -专利权人：厦门亿联网络技术股份有限公司
申请日： 2020-09-08 - 公布日： 2021-01-15 - 主分类号： G10L15/06 文献下载
摘要：本发明公开了一种用于频带扩展算法的数据生成方法，步骤包括：采集语音数据，所述语音数据包括宽带语音数据、混响数据及噪声数据；在所述宽带语音数据的基础上，按照设定概率添加所述混响数据和所述噪声数据，以生成宽带语音训练数据；对所述宽带语音训练数据进行下采样处理以生成对应的窄带语音训练数据，并输出所述宽带语音训练数据和所述窄带语音训练数据。本发明提供了一种用于频带扩展算法的数据生成方法、系统及存储介质，能够依据少量现有数据集快速生成海量的训练数据。
一种用于频带扩展算法数据生成方法系统存储介质

[发明专利]基于对抗训练的领域语音识别训练方法-CN201810397535.5在审
发明人：宋荣 -专利权人：上海适享文化传播有限公司
申请日： 2018-04-27 - 公布日： 2018-09-28 - 主分类号： G10L15/06 文献下载
摘要：本发明涉及一种基于对抗训练的领域语音识别训练方法，为了提高计算机对语音的识别率而设计。本发明基于对抗训练的领域语音识别训练方法包括：输入一个音频文件作为训练输入；分别通过通用语音引擎和领域语音模型识别文本；领域识别模型，按照输入的初步文本确定语音最有可能对应的2个领域；按照匹配的领域，利用各自的领域模型进行文本转换；匹配两个领域语音模型输入文本和原始输入文本的近似度，选择高匹配结果；然后比对通用语音识别的结果和领域语音模型识别的结果.如果结果不匹配，把训练结果和对应语音导入领域特征库，开始下一次迭代训练整体模型的匹配程度达到目标后，完成领域语音识别模型的训练。
语音识别匹配对抗训练语音模型输入文本通用语音语音文本领域模型领域识别领域特征匹配结果文本转换训练结果一次迭代音频文件整体模型近似度识别率比对引擎计算机

首页
«上一页
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
下一页»
尾页
共 100000 条