“目标语音”专利关键词查询_检索下载_查询列表_检索列表_行业专利分布_钻瓜专利网

钻瓜专利网为您找到相关结果1034343个，建议您升级VIP下载更多相关专利

[发明专利]基于TS-VAD的通用语音提取方法-CN202310135769.3在审
发明人：张海剑;左世玉;张吴胜 -专利权人：武汉大学
申请日： 2023-02-13 - 公布日： 2023-06-06 - 主分类号： G10L17/02 文献下载
摘要：本发明公开了基于TS‑VAD的通用语音提取方法，包括：1)预训练的多尺度编码器对输入的混合录音和参考语音进行特征转换。2)预训练的嵌入提取出目标对象的嵌入向量。3)预训练语音提取网络建立目标语音的掩蔽。4)预训练多尺度语音解码器恢复目标语音波形。5)预训练后，固定预训练网络的多尺度编码器、嵌入向量提取网络和部分语音提取网络，6)微调网络的目标语音检测部分实现TS‑VAD概率向量估计。7)微调网络的目标语音提取部分估计出目标语音向量。8)微调网络二值化TS‑VAD概率向量，并与估计的目标语音向量相乘，得到最终输出语音。本发明在通用语音提取方面具有准确性，鲁棒性，并且在目标对象缺席的情况下能够有效地抑制静音对模型的负面影响。
基于 ts vad 通用语音提取方法

[发明专利]语音消息的处理方法、装置及电子设备-CN202210750656.X在审
发明人：许静 -专利权人：网易（杭州）网络有限公司
申请日： 2022-06-28 - 公布日： 2022-11-18 - 主分类号： G10L15/26 文献下载
摘要：本发明提供了一种语音消息的处理方法、装置及电子设备，识别目标语音消息的语音内容，基于识别的语音内容，将目标语音消息划分为至少一段语音段落；响应针对至少一段语音段落中，第一语音段落的编辑操作，获取第一语音段落的更新语音段落；将第一语音段落替换为更新语音段落，得到编辑后的目标语音消息。该方法通过将目标语音消息识别为多个语音段落，使得用户可以针对每个语音片段进行编辑操作，录入对应的更新语音段落，从而对目标语音消息中的语音片段进行更改，提升了用户通过语音消息进行沟通的体验。
语音消息处理方法装置电子设备

[发明专利]直播语音信息处理方法、装置、设备及存储介质-CN202210495214.5在审
发明人：沈志铭 -专利权人：广州博冠信息科技有限公司
申请日： 2022-05-07 - 公布日： 2022-10-25 - 主分类号： G10L15/02 文献下载
摘要：本发明涉及视频直播技术领域，公开了一种直播语音信息处理方法、装置、设备及存储介质。该方法包括：获取目标语音信号，并将目标语音信号转换至指定频域，得到目标语音信号的频域信号；从频域信号中提取目标语音信号的信号特征，并利用预置关键信号对应的特征参考模式，对信号特征进行模式匹配，得到目标语音信号和关键信号之间的第一匹配距离；对比第一匹配距离和预先设置的参考距离之间的大小，并基于对比的结果确定对目标语音信号的处理结果。本发明实现了直播过程中的语音自动化审核，提升了直播语音审核的效率以及执行审核行为的实时性。
直播语音信息处理方法装置设备存储介质

[发明专利]一种语音识别方法及装置-CN201910130555.0有效
发明人：潘嘉;魏思;王智国 -专利权人：科大讯飞股份有限公司
申请日： 2019-02-21 - 公布日： 2022-01-04 - 主分类号： G10L15/02 文献下载
摘要：本申请公开了一种语音识别方法及装置，该方法包括：在获取到待识别的目标语音后，将从预先构建的记忆体中获取与目标语音匹配的表示信息，其中，记忆体中存储了大量的样本说话人表示结果和/或样本说话环境表示结果，进而，可以根据从记忆体中获取的表示信息，对目标语音进行识别。可见，由于记忆体中存储了大量的样本说话人表示结果和/或样本说话环境表示结果，所以，能够从记忆体中获取到与目标语音的说话人和/或说话环境相匹配的表示信息，用以丰富目标语音的识别依据，从而能够在对目标语音进行在线的个性化语音识别时，提高语音识别效果和效率。
一种语音识别方法装置

[发明专利]一种语音识别方法、声学模型的训练方法、装置及设备-CN202210006570.6在审
发明人：李思琪;付立 -专利权人：京东科技信息技术有限公司
申请日： 2022-01-04 - 公布日： 2023-07-14 - 主分类号： G10L15/02 文献下载
摘要：本申请提供一种语音识别方法、声学模型的训练方法、装置及设备。该语音识别方法包括：接收语音识别请求，语音识别请求包括目标语种的待识别语音；对待识别语音提取语音特征并输入第一声学模型，得到声学特征，声学特征包括待识别语音的可能性字符，第一声学模型是根据第一语音样本和第二语音样本，基于神经网络进行训练得到的用于识别语音数据中目标语种的可能性字符的模型，第一语音样本包括人工标定的多个语音样本和对应的目标语种的字符，第二语音样本包括采用第一语音样本训练的第二声学模型标定的多个语音样本和对应的目标语种的字符；根据声学特征确定目标语种的语音识别结果并输出。本申请的方法提高了目标语种的语音识别准确度。
一种语音识别方法声学模型训练装置设备

[发明专利]基于蓝牙耳机的通信方法、计算机设备及可读存储介质-CN202211482261.2在审
发明人：孙春阳 -专利权人：深圳开鸿数字产业发展有限公司
申请日： 2022-11-24 - 公布日： 2023-05-02 - 主分类号： H04W4/20 文献下载
摘要：本申请提供一种基于蓝牙耳机的通信方法、计算机设备及存储介质，该方法包括：在接收到目标蓝牙耳机发出的语音录制指令时，控制目标蓝牙耳机获取目标语音文件；将所述目标语音文件基于网关端发送至超级终端，以使得所述超级终端接收到所述语音文件；通过所述超级终端对所述目标语音文件进行解析，得到所述目标语音文件的待接收对象；通过网关端将所述目标语音文件发送至所述待接收对象对应的蓝牙耳机。
基于蓝牙耳机通信方法计算机设备可读存储介质

[发明专利]一种语音处理方法、装置及计算机可读存储介质-CN202111345799.4在审
发明人：鲍枫 -专利权人：腾讯科技（深圳）有限公司
申请日： 2021-11-15 - 公布日： 2023-05-16 - 主分类号： G10L21/0232 文献下载
摘要：本申请提出了一种语音处理方法、装置及计算机可读存储介质，可以应用于云技术、人工智能、区块链、车联网、智慧交通、智能家居等各种领域或场景，该方法包括：获取目标语音数据的语音特征；所述语音特征包括静态频域特征、动态频域特征、频谱斜率特征和频谱能量特征中的一种或多种；利用增益预测模型对所述目标语音数据的语音特征进行处理，得到所述目标语音数据的增益信息；所述增益预测模型是根据含噪语音数据的语音特征训练得到的；根据所述目标增益信息对所述目标语音数据进行增强处理，得到所述目标语音数据对应的增强语音数据。采用本申请实施例，可以高效、准确地对语音增强，提升语音降噪的效果。
一种语音处理方法装置计算机可读存储介质

[发明专利]语音合成方法、装置、计算机设备及存储介质-CN201911368538.7有效
发明人：劳振锋;肖纯智 -专利权人：广州酷狗计算机科技有限公司
申请日： 2019-12-26 - 公布日： 2023-05-26 - 主分类号： G10L13/047 文献下载
摘要：本申请公开了一种语音合成方法、装置、计算机设备及存储介质，属于语音信号处理领域。方法包括：获取第一对象的原始语音；对原始语音进行语音识别，得到原始语音对应的原始发音序列，原始发音序列中包括原始语音中各个字词的原始字词发音；从目标字词库中获取原始字词发音对应的目标字词发音，目标字词库中存储有第二对象对各个字词的字词发音；对各个目标字词发音进行拼接，生成目标发音序列；根据目标发音序列合成目标语音，目标语音具有第二对象的声音特征。采用本申请的语音合成方法，可直接利用第二对象的声音特征来实现合成目标语音，提高了语音合成的准确性，且目标语音具备原始语音的音高特征，使得目标语音呈现原始语音的流畅度。
语音合成方法装置计算机设备存储介质

[发明专利]语音处理方法、装置、系统及存储介质-CN201911109001.9有效
发明人：张银平;杨琳;汪俊杰;贾宸;梁玉龙 -专利权人：联想（北京）有限公司
申请日： 2019-11-13 - 公布日： 2022-10-25 - 主分类号： G10L15/25 文献下载
摘要：本申请提供了一种语音处理方法、装置、系统及存储介质，在嘈杂的场景下，多媒体处理设备获取包含多个语音的语音信息及视频界面展示的人脸图像后，通过对该人脸图像的嘴部区域进行追踪检测，得到相应的嘴部运行信息，由于不同嘴部运动信息对应的语音往往不同，所以，本申请可以据此直接从这多个语音信息中，提取与该嘴部运动信息匹配的目标语音信息，即提取处视频界面展示的发言人的目标语音，之后，通过增强目标语音的信号强度，增大该目标语音信息与其他语音信息(即噪声)之间的信号强度的差距，突出输出的目标语音信息，提高了嘈杂场景下识别目标语音信息的效率及准确性，保证收听者能够准确地得知发言人的发言内容。
语音处理方法装置系统存储介质

[发明专利]语音处理方法、装置、计算机可读存储介质及计算机设备-CN202111620262.4在审
发明人：孟廷;江源;宋锐 -专利权人：科大讯飞股份有限公司
申请日： 2021-12-28 - 公布日： 2022-04-01 - 主分类号： G10L13/02 文献下载
摘要：本申请实施例公开了一种语音处理方法、装置、计算机可读存储介质及计算机设备。该方法包括：根据来自终端的语音合成服务请求，确定目标性能数据以及目标发音对象的语音数据，该语音数据具有目标音色，根据目标性能数据对初始语音合成模型中的目标网络模块进行裁剪处理，以得到待训练语音合成模型，并利用语音数据对待训练语音合成模型进行训练，得到目标语音合成模型，以使得终端利用目标语音合成模型对目标文本进行语音合成处理，得到具有目标音色的合成语音数据。本申请实施例可得到与终端的性能数据匹配的目标语音合成模型，从而基于该目标语音合成模型提供符合终端的目标性能数据的语音合成服务，改善用户体验。
语音处理方法装置计算机可读存储介质设备

[发明专利]终端设备的语音控制方法和装置、存储介质及电子设备-CN202210302041.0在审
发明人：郭延文 -专利权人：青岛海尔科技有限公司;海尔智家股份有限公司
申请日： 2022-03-25 - 公布日： 2022-06-28 - 主分类号： G10L15/22 文献下载
摘要：本发明公开了一种终端设备的语音控制方法和装置、存储介质及电子设备。其中，该方法包括：在接收到目标语音的情况下，获取目标语音的语音识别结果，其中，目标语音为终端设备网络采集到的语音数据；在语音识别结果表征目标语音属于设备控制类语音的情况下，开启目标异步线程，并基于语音识别结果对目标语音进行语义解析；利用目标异步线程调用设备列表服务，以通过设备列表服务获取终端设备列表，终端设备列表中包括位于终端设备网络中的终端设备的设备信息；根据语义解析结果从终端设备列表中查找出目标终端设备，并将与语义解析结果匹配的目标控制指令下发至目标终端设备本发明解决了设备列表调用耗时较长导致语音控制效率低的技术问题。
终端设备语音控制方法装置存储介质电子设备

[发明专利]基于PSTN网络的号码状态自动识别方法及装置-CN201610948691.7在审
发明人：陈培武;李幼庭;郭豫丹 -专利权人：广东亿迅科技有限公司
申请日： 2016-10-25 - 公布日： 2017-02-22 - 主分类号： H04M1/725 文献下载
摘要：本发明公开一种基于PSTN网络的号码状态自动识别方法及装置，其中，该PSTN网络中号码状态自动识别方法包括如下步骤：在收到PSTN网络返回的拨号失败信令时，接收经自动录音的语音信号，形成目标语音；在收到PSTN网络返回的挂机信令时，调用语音库中预存的收录语音，其中，收录语音包含有至少一状态语音；判断目标语音与语音库的收录语音是否匹配，当目标语音与收录语音匹配成功时，找出与目标语音匹配的状态语音，以识别目标语音对应号码的状态
基于 pstn 网络号码状态自动识别方法装置

[发明专利]一种语音泛化方法、装置及计算机存储介质-CN202010820913.3在审
发明人：孙中全 -专利权人：博泰车联网(南京)有限公司
申请日： 2020-08-14 - 公布日： 2020-12-01 - 主分类号： G10L15/26 文献下载
摘要：本发明公开了一种语音泛化方法、装置及计算机存储介质，所述语音泛化方法包括：获取当前用户在历史对话中输入的至少一目标语音；其中，所述目标语音为识别失败的语音；确定所述目标语音满足预设泛化条件时，对所述目标语音进行泛化处理，以使所述目标语音能被识别成功。本发明提供的语音泛化方法、装置及计算机存储介质，通过搜集用户在历史对话中输入的语音，并在语音满足预设泛化条件时对语音进行泛化处理，以实现自动泛化用户语音，提高了语音泛化的及时性和效率，并提升了用户使用体验
一种语音泛化方法装置计算机存储介质

[发明专利]语音转换方法、装置和电子设备-CN202111546962.3在审
发明人：魏凌 -专利权人：维沃移动通信有限公司
申请日： 2021-12-16 - 公布日： 2022-03-25 - 主分类号： G10L15/22 文献下载
摘要：本申请公开了一种语音转换方法、装置和电子设备，涉及终端领域。所述方法包括：接收第一输入；根据所述第一输入，确定目标语音消息；获取所述目标语音消息对应的目标文本；基于所述目标语音消息对应的目标文本和预先建立的目标库，确定所述目标文本对应的目标情感指示标识，所述目标情感指示标识用于反应所述目标语音消息对应的目标用户的情感；显示所述目标语音消息对应的目标结果，所述目标结果中包括所述目标文本和所述目标情感指示标识；其中，所述目标库中存储文本与情感指示标识之间的对应关系，所述文本与情感指示标识之间的对应关系是基于视频会话建立的
语音转换方法装置电子设备

[发明专利]用于识别语音的方法、装置、设备、介质和产品-CN202111049667.7在审
发明人：赵情恩 -专利权人：北京百度网讯科技有限公司
申请日： 2021-09-08 - 公布日： 2021-12-07 - 主分类号： G10L17/26 文献下载
摘要：本公开提供了用于识别语音的方法、装置、设备、介质和产品，涉及人工智能技术领域，尤其涉及语音技术领域。具体实现方案为：获取目标语音；基于目标语音和预设的语音识别模型，确定目标语音对应的用户特征向量集合；将用户特征向量集合中的各个用户特征向量拼接，得到目标特征向量；基于目标特征向量，确定目标语音对应的用户特征信息
用于识别语音方法装置设备介质产品