“语音样本”专利关键词查询_检索下载_查询列表_检索列表_行业专利分布_钻瓜专利网

钻瓜专利网为您找到相关结果362750个，建议您升级VIP下载更多相关专利

[发明专利]一种语音合成模型的训练方法及一种语音合成方法-CN202010175459.0在审
发明人：杨丽兵 -专利权人： TCL科技集团股份有限公司
申请日： 2020-03-13 - 公布日： 2021-09-28 - 主分类号： G10L13/02 文献下载
摘要：本申请适用于计算机技术领域，尤其涉及一种语音合成模型的训练方法及一种语音合成方法。所述语音合成模型的训练方法包括：对第一语音样本进行发音标注，获取第一语音样本的文本序列；将第一语音样本及第一语音样本的文本序列成对地输入至预设的语音合成模型中进行处理，得到与第一语音样本的文本序列对应的输出音频及所述第一语音样本的音频特征；根据第一语音样本的音频特征和输出音频，对语音合成模型的参数进行调整，直至满足预设的训练条件，以得到已训练的语音合成模型。本申请中，能够基于方言的样本语音进行发音标注，进而得到能够合成具备该方言发音特点的语音合成模型，提高方言语音合成的质量。
一种语音合成模型训练方法

[发明专利]基于语音合成模型的预训练方法、装置和电子设备-CN202210552552.8在审
发明人：樊晓然;郑人杰;陈俊坤;朱鹏飞;庞超;王硕寰;原湉;李昕同;孙宇;黄亮;陈泽裕 -专利权人：北京百度网讯科技有限公司
申请日： 2022-05-20 - 公布日： 2022-08-12 - 主分类号： G10L13/02 文献下载
摘要：本公开公开了一种基于语音合成模型的预训练方法、装置和电子设备，尤其涉及自然语言处理、深度学习、语音技术等人工智能技术领域。其中，方案为：获取语音样本数据及语音样本数据对应的文本样本数据；对语音样本数据进行特征提取，以生成样本语音特征；根据样本语音特征和跨语言音素表，生成语音矩阵特征；根据语音矩阵特征和文本样本数据进行联合掩码学习，以对语音合成模型进行预训练。由此，通过语音矩阵特征和文本样本数据的联合掩码学习，对语音合成模型进行预训练，也即在对语音合成模型进行预训练的过程中，充分考虑到了语音特征和文本特征的联合训练，从而可使得生成的语音合成模型更为准确可靠，进而为提高语音合成质量提供了条件。
基于语音合成模型训练方法装置电子设备

[发明专利]一种针对声纹鉴定任务的语音降噪方法及装置-CN202310492167.3有效
发明人：张兆峰;邓菁 -专利权人：北京远鉴信息技术有限公司
申请日： 2023-05-05 - 公布日： 2023-07-21 - 主分类号： G10L17/02 文献下载
摘要：本公开提供了一种针对声纹鉴定任务的语音降噪方法及装置，通过获取样本含噪语音与样本净语音；确定样本含噪语音的说话人对应的第一身份认证矢量，以及样本净语音的说话人对应的第二身份认证矢量；针对样本含噪语音与样本净语音中的每一帧，确定该帧样本含噪语音对应的第一频域向量，以及该帧样本净语音对应的第二频域向量；根据第一身份认证矢量、第二身份认证矢量、第一频域向量以及第二频域向量训练预设的语音降噪模型；获取待降噪语音，将待降噪语音输入至训练好的语音降噪模型中，确定待降噪语音对应的目标降噪语音。可以在减少噪音影响的同时，保留了语音的身份特征信息，从而有效提升声纹鉴定任务性能的效果。
一种针对声纹鉴定任务语音方法装置

[发明专利]一种语音情感识别方法、装置及电子设备-CN202211014757.7在审
发明人：赵玉坤;张磊;李聚兴;邹增晖;胡景忠 -专利权人：河北工大科雅能源科技股份有限公司
申请日： 2022-08-23 - 公布日： 2022-11-29 - 主分类号： G10L25/63 文献下载
摘要：本发明提供一种语音情感识别方法、装置及电子设备。该方法包括：将目标语音片段切分为多个设定时长的语音切片，并提取每个语音切片的语音特征值；基于多个语音切片的语音特征值，计算多个语音切片中每个语音切片与多个已知情感类型的语音样本中每个语音样本之间的相似度；将多个语音切片与同一语音样本之间的相似度进行加和，得到目标语音片段与该语音样本之间的相似度；基于目标语音片段与各语音样本之间的相似度，以及各语音样本的情感类型，确定目标语音片段的情感类型。本发明能够提高语音情感识别的准确度。
一种语音情感识别方法装置电子设备

[发明专利]变声语音还原方法、装置、计算机设备和存储介质-CN202010719804.2在审
发明人：张伟彬;黄河清 -专利权人：深圳市声扬科技有限公司
申请日： 2020-07-24 - 公布日： 2020-10-02 - 主分类号： G10L21/013 文献下载
摘要：本申请涉及一种变声语音还原方法、装置、计算机设备和存储介质。所述方法包括：获取原始语音样本；通过目标程序对所述原始语音样本进行变声处理，得到变声语音样本；分别对所述原始语音样本和所述变声语音样本进行语音信号特征提取，获得所述原始语音样本的第一语音信号特征值集合和所述变声语音样本的第二语音信号特征值集合；根据第一语音信号特征值集合和第二语音信号特征值集合包含的对应的语音信号特征值间的映射关系，确定还原函数；基于所述还原函数，对通过所述目标程序变声得到的待还原变声语音进行变声还原。采用本方法能够降低变声语音还原的成本。
变声语音还原方法装置计算机设备存储介质

[发明专利]一种语音识别模型的训练以及语音识别的方法和装置-CN202010639895.9有效
发明人：康燕斌;张志齐 -专利权人：上海依图信息技术有限公司
申请日： 2020-07-06 - 公布日： 2023-05-02 - 主分类号： G10L15/06 文献下载
摘要：本申请公开了一种语音识别模型的训练以及语音识别的方法和装置，属于人工智能技术领域，该方法包括，获取标注语音样本集合，以及无标注语音样本集合；根据标注语音样本集合，分别对每一预设的语音识别教师模型进行训练，获得训练好的语音识别教师模型；分别针对每一训练好的语音识别教师模型，将无标注语音样本集合中的各语音样本输入至语音识别教师模型中，输出相应的文本信息；根据标注语音样本集合、无标注语音样本集合以及相应的文本信息，对预设的语音识别学生模型进行训练，获得目标语音识别模型。获取待识别的语音数据；将语音数据输入至训练好的目标语音识别模型，输出语音识别结果。这样，提高了目标语音识别模型的性能。
一种语音识别模型训练以及方法装置

[发明专利]一种语音样本混淆方法及装置-CN202211137162.0在审
发明人：介飞;张海俊;汪锦想;于振华;宋彦 -专利权人：中国科学技术大学
申请日： 2022-09-19 - 公布日： 2022-12-20 - 主分类号： G10L15/08 文献下载
摘要：本申请公开了一种语音样本混淆方法及装置，在该方法中，获取属于多个语音数据源的多个语音样本对应的多个样本索引；按照预设块大小对多个样本索引分块得到多个块索引；混淆多个块索引得到混淆后的多个块索引，实现多个语音数据源粒度的语音样本混淆；从混淆后的多个块索引中选取预设数量的块索引作为多个待处理块索引；将多个待处理块索引包括的样本索引划分成多个批量索引；混淆多个批量索引得到混淆后的多个批量索引，实现多个批量语音样本粒度的语音样本混淆；通过混淆后的多个批量索引包括的样本索引，获取多个待处理语音样本。由此，实现对海量语音样本的充分、全局混淆，提高模型训练过程的稳定性。
一种语音样本混淆方法装置

[发明专利]语音活动检测模型的训练及检测方法、装置、设备和介质-CN202211345386.0在审
发明人：王海平 -专利权人：广州方硅信息技术有限公司
申请日： 2022-10-31 - 公布日： 2022-12-20 - 主分类号： G10L25/87 文献下载
摘要：本申请涉及音频及直播技术领域，提供一种语音活动检测模型训练及检测方法、装置、设备和介质。本申请能够提高语音活动检测模型的检测精确率。包括：将纯净语音信号样本分帧得到多个纯净语音信号帧样本，获取该多个信号帧样本各自对应的对数能量的归一化值，针对每一信号帧样本，获取该信号帧样本前后第一预设数量个信号帧样本中第一纯净语音信号帧样本的占比，该第一纯净语音信号帧样本为对数能量的归一化值大于阈值的信号帧样本，根据该占比确定该信号帧样本对应的语音活动检测标签，根据信号帧样本和预设噪声得到携带噪声的信号帧样本，利用携带噪声的信号帧样本和语音活动检测标签对待训练的语音活动检测模型进行训练
语音活动检测模型训练方法装置设备介质

[发明专利]一种基于验证码的语音数据样本采集系统及其方法-CN201910065909.8在审
发明人：刘作;陈杨;罗一鸣;张强;黄忠山;郭夏杰 -专利权人：中国—东盟信息港股份有限公司
申请日： 2019-01-24 - 公布日： 2019-05-21 - 主分类号： G10L15/22 文献下载
摘要：本发明公开了一种基于验证码的语音数据样本采集系统及其方法，用户终端与语音验证及采集模块连接，用户通过用户终端发起校验请求，通过主要由样本采集服务器、样本数据库、呼叫终端和语音转文字服务器构成的语音验证及采集模块为用户终端提供验证服务，在使用时，语音验证及采集模块根据校验请求发出标准文字样本数据，用户根据指令通过用户终端朗读标准文字样本数据的文字内容，得到语音样本；语音验证及采集模块对该语音样本进行语音转文字的处理，得到即时文字样本，进行验证对比，对比成功则采集该语音样本，否则丢弃。整个过程，只需用户验证参与即可，无需现场采集，与传统人工录入的做法相比，语音样本采集工作量少、采样成本的投入更低。
采集模块用户终端语音验证语音样本语音数据样本标准文字采集系统校验请求样本数据验证码服务器语音采集样本数据库采样成本传统人工呼叫终端文字内容现场采集验证对比验证服务样本采集朗读录入工作量丢弃样本验证指令成功

[发明专利]语音分类模型的训练方法、装置、设备及存储介质-CN202210042806.1在审
发明人：司世景;王健宗 -专利权人：平安科技（深圳）有限公司
申请日： 2022-01-14 - 公布日： 2022-04-15 - 主分类号： G10L15/06 文献下载
摘要：本申请涉及人工智能领域，具体公开了一种语音分类模型的训练方法、装置、设备及存储介质，所述方法通过获取样本数据，所述样本数据包括样本语音和所述样本语音对应的样本标签；对所述样本语音进行预处理，得到所述样本语音对应的向量矩阵；将所述向量矩阵输入初始语音分类模型的变分信息瓶颈处理网络，得到所述样本语音对应的句子表征；将所述句子表征输入所述初始语音分类模型的分类网络得到预测标签，然后根据所述样本标签和所述预测标签对所述初始语音分类模型的进行迭代训练，从而得到训练好的语音分类模型。在语音分类模型中加入变分信息瓶颈处理网络，压缩了样本信息并抑制了无用信息，从而减小了过拟合现象的发生。
语音分类模型训练方法装置设备存储介质

[发明专利]一种基于网络配音游戏的语音样本收集方法-CN201710389619.X有效
发明人：贺前华;吴俊峰;汪星 -专利权人：华南理工大学
申请日： 2017-05-27 - 公布日： 2020-11-24 - 主分类号： G10L15/00 文献下载
摘要：本发明提供了一种基于网络配音游戏的语音样本收集方法，包括：步骤101语音样本收集环节，通过用户点播视频，然后跟随视频字幕进行配音，配音后用户可在客户端对自己的原声进行变声处理，后台服务器端结合基于PESQ的客观语音质量评价和语音识别对原始音频进行机器打分；步骤102语音样本抽样主观评价环节，抽取语音样本在游戏首页展示，用户对展示语音样本进行试听评价后，选择“符合原文”或“不符原文”按钮，对用户选择“不符原文”按钮数量较多的语音样本，后台进行人工试听，人工试听后确实与文本不符的语音样本从样本库中剔除。本发明解决了现有人工现场录制语音样本方案录制成本高、时间长，和人工电话录制方案语音样本包含信道噪声的缺点。
一种基于网络配音游戏语音样本收集方法

[发明专利]语音识别模型的生成方法及其装置-CN201910005075.1有效
发明人：徐扬凯;李超 -专利权人：百度在线网络技术（北京）有限公司
申请日： 2019-01-03 - 公布日： 2022-06-24 - 主分类号： G10L15/06 文献下载
摘要：本发明公开了一种语音识别模型的生成方法及其装置。其中，方法包括：获取多种环境下的噪声信号，以及无噪声的样本语音信号。根据多种环境下的噪声信号和无噪声的样本语音信号，生成多种带噪声的样本语音信号。使用样本语音信号，对深度神经网络进行训练，以生成语音识别模型。其中，样本语音信号包括多种带噪声的样本语音信号和无噪声的样本语音信号。由此，实现了使用不同的样本语音信号对深度神经网络进行训练，以生成能够应对不同环境噪声的语音识别模型，增强了语音识别模型的鲁棒性。解决了现有技术中不能对不同环境下的噪声进行处理的技术问题。
语音识别模型生成方法及其装置

[发明专利]数据清洗方法、装置及存储介质-CN202210287983.6在审
发明人：王伟 -专利权人：北京小米移动软件有限公司
申请日： 2022-03-22 - 公布日： 2022-06-10 - 主分类号： G10L15/22 文献下载
摘要：本公开涉及一种数据清洗方法、装置及存储介质，该方法包括：获取用于唤醒目标设备的语音样本数据，以及当前语音唤醒模型输出的语音样本数据对应的唤醒结果信息，唤醒结果信息用于表征目标设备是否被唤醒；确定语音样本数据与用于唤醒目标设备的标准语音唤醒数据之间的差异信息；根据唤醒结果信息和差异信息，对语音样本数据进行清洗，以确定语音样本数据的分类标签。通过上述技术方案，根据唤醒结果信息和差异信息对语音样本数据进行清洗，这样确定的语音样本数据的分类标签，相比于当前语音唤醒模型输出的唤醒结果更加准确，提高语音样本数据的标签的准确性，且无需人工对语音样本数据的标签进行标注
数据清洗方法装置存储介质

[发明专利]豪萨语语音模型的训练方法、识别方法及装置-CN202011553156.4在审
发明人：龚科;熊浩 -专利权人：暗物智能科技(广州)有限公司
申请日： 2020-12-24 - 公布日： 2022-06-28 - 主分类号： G10L15/06 文献下载
摘要：本发明涉及语音识别技术领域，具体涉及豪萨语语音模型的训练方法、识别方法及装置，所述训练方法包括获取英语音频样本及其对应的第一文本样本，以及豪萨语音频样本及其对应的第二文本样本；利用英语音频样本及其对应的第一文本样本对豪萨语语音模型进行训练，确定豪萨语语音模型中卷积单元的初始参数，以得到初始豪萨语语音模型，所述豪萨语语音模型包括卷积单元以及与卷积单元连接的全连接层；利用豪萨语音频样本及其对应的第二文本样本对初始豪萨语语音模型进行训练，对初始参数以及全连接层的参数进行调整，以确定目标豪萨语语音模型。通过迁移学习的方法既能够避免豪萨语音频样本不足的问题，又保证训练得到的豪萨语语音模型的准确性。
豪萨语语音模型训练方法识别装置

[发明专利]语音与图像同步性衡量模型的训练方法及装置-CN202111058177.3有效
发明人：王淳;曾定衡;王洪斌;吴海英;周迅溢;蒋宁 -专利权人：马上消费金融股份有限公司
申请日： 2021-09-09 - 公布日： 2023-09-22 - 主分类号： G06V20/40 文献下载
摘要：本申请提供一种语音与图像同步性衡量模型的训练方法及装置，该方法包括：将第一图像片段处理为第一图像数据、第一语音片段处理为第一语音数据、第二语音片段处理为第二语音数据，将随机图像片段处理为第二图像数据、随机语音片段处理为第三语音数据，将第一图像数据和第一语音数据组成正样本，将第一图像数据和第二语音数据组成第一负样本，将第一图像数据和第三语音数据组成第二负样本，将第一语音数据或第二语音数据，和第二图像数据组成第三负样本，采用正样本、第一负样本、第二负样本和第三负样本训练语音与图像同步性衡量模型。这样，使得训练样本的类型更加丰富，能够提高语音与图像同步性衡量模型的精确度。
语音图像同步衡量模型训练方法装置