“语音声学”专利关键词查询_检索下载_查询列表_检索列表_行业专利分布_钻瓜专利网

钻瓜专利网为您找到相关结果189626个，建议您升级VIP下载更多相关专利

[发明专利]语音识别方法和装置-CN201811036633.2有效
发明人：陈旭;翟传磊;白锦峰 -专利权人：百度在线网络技术(北京)有限公司
申请日： 2018-09-06 - 公布日： 2019-11-15 - 主分类号： G10L15/02 文献下载
摘要：本申请实施例公开了语音识别方法和装置。该方法的一具体实施方式包括：从待处理语音信号中提取出声学特征，并基于待处理语音信号的声学特征进行语音识别，得到待处理语音信号对应的识别文本；将待处理语音信号的声学特征和待处理语音信号对应的识别文本输入已训练的音节对齐模型，得到待处理语音信号的声学特征对应的音节序列；基于待处理语音信号的声学特征对应的音节序列对待处理语音信号的声学特征进行定长处理，得到待处理语音信号的定长声学特征；采用已训练的声学置信度模型对待处理语音信号的定长声学特征进行声学置信度预测，得到待处理语音信号的声学置信度。该实施方式提升了声学置信度判决精度。
语音信号声学特征置信度声学语音识别定长方法和装置音节序列文本音节对齐判决申请预测

[发明专利]语音识别方法和装置-CN201610586698.9有效
发明人：丁科;蒋兵;李先刚 -专利权人：百度在线网络技术（北京）有限公司
申请日： 2016-07-22 - 公布日： 2019-05-31 - 主分类号： G10L15/02 文献下载
摘要：本申请提出一种语音识别方法和装置，该语音识别方法包括：对输入的语音进行声学特征提取，得到声学特征；获取声学模型，其中，所述声学模型的参数是二值化参数；根据所述声学特征和所述声学模型进行语音识别。该方法能够适用于嵌入式语音识别。
语音识别方法装置

[发明专利]语音转换方法、装置和电子设备-CN202011025400.X在审
发明人：王锡磊;王文富;孙涛 -专利权人：北京百度网讯科技有限公司
申请日： 2020-09-25 - 公布日： 2021-01-22 - 主分类号： G10L13/02 文献下载
摘要：本申请公开了语音转换方法、装置和电子设备，涉及语音转换、语音交互、自然语言处理、深度学习技术领域。具体实现方案为：获取第一用户的源语音和第二用户的参照语音；从源语音中提取出第一语音内容信息和第一声学特征；从参照语音中提取出第二声学特征；将第一语音内容信息、第一声学特征和第二声学特征输入至预先训练好的语音转换模型中，得到重构的第三声学特征，预先训练好的语音转换模型根据第三用户的语音训练得到；以及根据第三声学特征合成目标语音。该方法将源语音的第一语音内容信息和第一声学特征、参照语音的第二声学特征输入至预先训练好的语音转换模型中，得到并根据重构的第三声学特征合成目标语音，可缩短语音转换的等待时间。
语音转换方法装置电子设备

[发明专利]语音识别方法和装置-CN201910054959.6在审
发明人：张仕良;雷鸣 -专利权人：阿里巴巴集团控股有限公司
申请日： 2019-01-21 - 公布日： 2020-07-28 - 主分类号： G10L15/02 文献下载
摘要：本申请公开了语音识别方法和装置。其中，语音识别方法包括：通过获取待识别的语音数据、及与语音数据对应的图像数据；通过声学特征提取子网络，提取语音数据的声学特征；以及，通过视觉特征提取子网络，从图像数据中提取与语音数据对应的视觉特征；通过声学得分预测子网络，至少根据声学特征和视觉特征，获取语音数据的声学得分；根据声学得分，确定与语音数据对应的文本序列。采用这种处理方式，使得既区分音频和视频在语音识别中的权重，又融合两种模态特征进行声学建模；因此，可以有效提升声学建模的性能及鲁棒性，从而提升语音识别性能及鲁棒性。
语音识别方法装置

[发明专利]一种语音识别方法、装置、电子设备及存储介质-CN202211521477.5在审
发明人：黄惠祥;林聚财;吴人杰;方瑞东;殷俊;史巍;岳昌洁;王宝俊 -专利权人：浙江大华技术股份有限公司
申请日： 2022-11-30 - 公布日： 2023-06-27 - 主分类号： G10L15/02 文献下载
摘要：本申请公开了一种语音识别方法、装置、电子设备及存储介质，根据待识别的语音信号中每个语音帧对应于每个第一音素的声学分，确定出待识别的语音信号的解码结果，并判断解码结果中包含预设的关键词时，分别针对关键词中的每个第二音素，根据该第二音素对应的各个语音帧中该第二音素的声学分，确定加权声学分，根据各个语音帧中每个语音帧的最大声学分，确定最大加权声学分，然后根据加权声学分和所述最大加权声学分，确定声学分置信度。这样得到的声学分置信度能够更准确的衡量解码结果的可信度。因此根据声学分置信度，确定语音识别结果可以保证语音识别的准确性。
一种语音识别方法装置电子设备存储介质

[发明专利]个性化多声学模型的训练方法、语音合成方法及装置-CN201510684475.1有效
发明人：李秀林 -专利权人：百度在线网络技术（北京）有限公司
申请日： 2015-10-20 - 公布日： 2015-12-23 - 主分类号： G10L13/02 文献下载
摘要：本发明公开了一种用于语音合成的个性化多声学模型的训练方法、语音合成方法及装置，其中，该方法包括：基于训练语音数据的第一声学特征数据和与训练语音数据对应的第一文本标注数据，训练基准声学模型；获取目标用户的语音数据；根据基准声学模型和语音数据，训练第一目标用户声学模型；根据第一目标用户声学模型和第一文本标注数据生成第一文本标注数据的第二声学特征数据；以及基于第一文本标注数据和第二声学特征数据，训练第二目标用户声学模型该实施例的模型训练方法，在训练目标用户声学模型过程中，降低了对目标用户的语音数据的规模的要求，利用少量的用户语音数据就可训练出多个包含目标用户的语音特点的个性化声学模型。
个性化声学模型训练方法语音合成装置

[发明专利]声学模型的训练、语音处理方法、装置、设备及存储介质-CN202110946708.6在审
发明人：王锡磊 -专利权人：北京百度网讯科技有限公司
申请日： 2021-08-18 - 公布日： 2021-11-16 - 主分类号： G10L13/047 文献下载
摘要：本公开提供了声学模型的训练、语音处理方法、装置、设备及存储介质，涉及人工智能中的深度学习和语音技术领域。具体实现方案为：获取样本文本和所述样本文本对应的样本语音，所述样本语音中包括多个语音片段，所述样本语音为目标用户的语音；根据所述样本语音，确定所述样本语音中语音片段的语音质量；通过待处理的声学模型对所述样本文本进行语音合成处理得到预测语音；根据所述样本语音、所述预测语音、以及所述样本语音中语音片段的语音质量，更新所述声学模型的模型参数，所述声学模型为所述目标用户对应的声学模型。通过上述过程，保证了训练后的声学模型的语音合成质量较高。
声学模型训练语音处理方法装置设备存储介质

[发明专利]语音检测方法及装置、设备及存储介质-CN202210861977.7有效
发明人：陶建华;王成龙;易江燕;张震;李鹏;石瑾;孙旭东 -专利权人：中国科学院自动化研究所;国家计算机网络与信息安全管理中心
申请日： 2022-07-21 - 公布日： 2022-10-11 - 主分类号： G10L17/04 文献下载
摘要：本公开涉及一种语音检测方法及装置、设备及存储介质，所述方法包括：接收待检测语音，根据待检测语音的编码状态序列中每一个编码状态向量及其对应的权重值确定语义声学特征；将待检测语音输入预先训练好的语音检测模型，将所述语音检测模型的隐藏层的输出作为语音声学特征；拼接所述语义声学特征和所述语音声学特征，并将拼接后的声学特征输入所述语音检测模型的输出层，输出待检测语音是真实的还是伪造的检测结果，结合待检测语音的语义声学特征检测语音的真伪，通过语义声学特征中待检测语音的编码状态向量与解码状态向量之间的相关性，能够结合待检测语音的上下文之间的相关性检测语音的真伪，提高检测的准确性。
语音检测方法装置设备存储介质

[发明专利]语音识别模型的训练方法、装置、设备及存储介质-CN202111018807.4在审
发明人：杨斌;吴海英;刘敏;蒋宁;王洪斌 -专利权人：马上消费金融股份有限公司
申请日： 2021-09-01 - 公布日： 2021-11-30 - 主分类号： G10L15/06 文献下载
摘要：本申请实施例提供一种语音识别模型的训练方法、装置、设备及存储介质，获取多个样本语音数据；根据关键词对应的声学特征中的信号帧进行建模，得到初始声学模型，每个声学特征包含多个信号帧；利用多个样本语音数据对初始声学模型进行训练，得到目标声学模型；根据目标声学模型构建语音识别模型。本申请通过关键词对应的帧级别的声学特征来构建声学模型，无需对样本语音数据进行对齐处理，训练过程相对简单，可以提升训练效率。
语音识别模型训练方法装置设备存储介质

[发明专利]高表现力的语音合成方法和装置-CN201410645715.2有效
发明人：李秀林;贾磊;康永国 -专利权人：百度在线网络技术（北京）有限公司
申请日： 2014-11-12 - 公布日： 2017-10-13 - 主分类号： G10L13/027 文献下载
摘要：本发明实施例公开了一种高表现力的语音合成方法和装置。所述高表现力的语音合成方法包括将输入文本进行处理分析，得到所述输入文本对应的音子序列以及所述音子序列中音子包含的状态的上下文；根据所述状态的上下文，基于维特比算法从所述状态对应的包含至少两个高斯声学模型的高斯混合声学模型中选择一个高斯声学模型，作为合成语音的高斯声学模型；根据所选择的高斯声学模型生成声学参数，并根据生成的声学参数合成语音，包括利用声码器将声学参数来合成语音或者用声学参数指导声学片段的单元挑选来生成语音。本发明实施例提供的高表现力的语音合成方法和装置提高了合成语音的自然度。
表现力语音合成方法装置

[发明专利]语音识别方法和装置、存储介质及电子设备-CN202211676144.X在审
发明人：邵琪杰;颜京豪;谢磊 -专利权人：腾讯科技（深圳）有限公司
申请日： 2022-12-26 - 公布日： 2023-10-27 - 主分类号： G10L15/00 文献下载
摘要：本申请公开了一种语音识别方法和装置、存储介质及电子设备。其中，该方法包括：获取待识别语音的文本内容声学向量和口音声学向量，其中，文本内容声学向量包括待识别语音中的T帧语音的文本内容声学特征，口音声学向量包括待识别语音中的T帧语音的口音声学特征；将文本内容声学向量输入第一解码器，得到目标对齐文本向量；将口音声学向量和目标对齐文本向量输入口音分类器，得到待识别语音的口音分类向量；将口音分类向量和文本内容声学向量进行拼接，得到目标拼接表征向量；通过第二解码器，根据目标拼接表征向量，确定从待识别语音中识别到的目标文本内容。本申请解决了相关技术中语音识别的准确率较低的技术问题。
语音识别方法装置存储介质电子设备

[发明专利]一种语音识别方法、声学模型的训练方法、装置及设备-CN202210006570.6在审
发明人：李思琪;付立 -专利权人：京东科技信息技术有限公司
申请日： 2022-01-04 - 公布日： 2023-07-14 - 主分类号： G10L15/02 文献下载
摘要：本申请提供一种语音识别方法、声学模型的训练方法、装置及设备。该语音识别方法包括：接收语音识别请求，语音识别请求包括目标语种的待识别语音；对待识别语音提取语音特征并输入第一声学模型，得到声学特征，声学特征包括待识别语音的可能性字符，第一声学模型是根据第一语音样本和第二语音样本，基于神经网络进行训练得到的用于识别语音数据中目标语种的可能性字符的模型，第一语音样本包括人工标定的多个语音样本和对应的目标语种的字符，第二语音样本包括采用第一语音样本训练的第二声学模型标定的多个语音样本和对应的目标语种的字符；根据声学特征确定目标语种的语音识别结果并输出。本申请的方法提高了目标语种的语音识别准确度。
一种语音识别方法声学模型训练装置设备

[发明专利]一种耳语音恢复方法、装置、设备及可读存储介质-CN201810325696.3有效
发明人：潘嘉;刘聪;王海坤;王智国;胡国平 -专利权人：科大讯飞股份有限公司
申请日： 2018-04-12 - 公布日： 2021-05-04 - 主分类号： G10L15/02 文献下载
摘要：本申请公开了一种耳语音恢复方法、装置、设备及可读存储介质，基于耳语音恢复模型实现，该耳语音恢复模型为预先以耳语音训练数据的识别结果及耳语音训练声学特征为样本，以与所述耳语音训练数据平行的正常语音数据对应的正常音声学特征为样本标签进行训练得到本申请获取耳语音数据对应的耳语音声学特征，及所述耳语音数据对应的初步识别结果，进而将耳语音声学特征及初步识别结果输入预置的耳语音恢复模型，得到输出的正常音声学特征，可以据此恢复耳语音。
一种耳语恢复方法装置设备可读存储介质

[发明专利]维语语音识别方法和装置-CN201510662027.1有效
发明人：王东;殷实;赵梦原;张之勇;张雪薇 -专利权人：清华大学
申请日： 2015-10-14 - 公布日： 2018-12-28 - 主分类号： G10L15/00 文献下载
摘要：本申请提供了一种维语语音识别的方法和装置，包括：将维语语音帧对应的声学特征作为自适应声学模型中的汉语声学模型的参数输入，经过线性变换和非线性变换将所述汉语声学模型下的维语语音帧对应的声学特征变换到汉语声学模型的高维非线性特征空间分布；将所述维语语音帧对应的汉语声学模型的高维非线性特征空间分布作为自适应声学模型中的维语声学模型的参数输入到所述维语声学模型中，训练所述维语声学模型，获得重构的自适应声学模型；使用遗传算法或者穷举算法筛选所述重构的自适应声学模型，获得最优自适应声学模型；使用所述最优自适应声学模型进行维语语音的识别，从而解决了维语语料不足和语音识别准确率低的问题。
语音识别方法装置

[发明专利]语音转换方法、系统、装置及存储介质-CN201980003189.0有效
发明人：王若童;汤志超;黄东延;谢杰斌;赵之源;刘洋;熊友军 -专利权人：深圳市优必选科技股份有限公司
申请日： 2019-12-24 - 公布日： 2023-05-23 - 主分类号： G10L21/013 文献下载
摘要：本申请公开了一种语音转换方法，所述方法包括：获取待转换语音，提取所述待转换语音的声学特征；从源向量池中获取与所述待转换语音对应的源向量，从目标向量池中选取目标语音对应的目标向量；将所述待转换语音的声学特征、所述待转换语音对应的源向量和所述目标语音对应的目标向量作为语音转换模型的输入，获取所述语音转换模型输出的目标语音声学特征；采用声码器对所述目标语音声学特征进行转换得到目标语音。通过语音转换模型得到目标语音声学特征，再对目标语音声学特征进行转换得到目标语音，使得单个语音转换模型能够进行多对多的语音转换，同时可以解决因存放模型而产生额外成本的问题。此外，还提出了一种语音转换系统、装置及存储介质。
语音转换方法系统装置存储介质

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
下一页»
尾页
共 100000 条