专利名称
主分类
A 农业
B 作业;运输
C 化学;冶金
D 纺织;造纸
E 固定建筑物
F 机械工程、照明、加热
G 物理
H 电学
专利下载VIP
公布日期
2023-10-24 公布专利
2023-10-20 公布专利
2023-10-17 公布专利
2023-10-13 公布专利
2023-10-10 公布专利
2023-10-03 公布专利
2023-09-29 公布专利
2023-09-26 公布专利
2023-09-22 公布专利
2023-09-19 公布专利
更多 »
专利权人
国家电网公司
华为技术有限公司
浙江大学
中兴通讯股份有限公司
三星电子株式会社
中国石油化工股份有限公司
清华大学
鸿海精密工业股份有限公司
松下电器产业株式会社
上海交通大学
更多 »
钻瓜专利网为您找到相关结果1034343个,建议您升级VIP下载更多相关专利
  • [发明专利]基于TS-VAD的通用语音提取方法-CN202310135769.3在审
  • 张海剑;左世玉;张吴胜 - 武汉大学
  • 2023-02-13 - 2023-06-06 - G10L17/02
  • 本发明公开了基于TS‑VAD的通用语音提取方法,包括:1)预训练的多尺度编码器对输入的混合录音和参考语音进行特征转换。2)预训练的嵌入提取出目标对象的嵌入向量。3)预训练语音提取网络建立目标的掩蔽。4)预训练多尺度语音解码器恢复目标波形。5)预训练后,固定预训练网络的多尺度编码器、嵌入向量提取网络和部分语音提取网络,6)微调网络的目标检测部分实现TS‑VAD概率向量估计。7)微调网络的目标提取部分估计出目标向量。8)微调网络二值化TS‑VAD概率向量,并与估计的目标向量相乘,得到最终输出语音。本发明在通用语音提取方面具有准确性,鲁棒性,并且在目标对象缺席的情况下能够有效地抑制静音对模型的负面影响。
  • 基于tsvad通用语音提取方法
  • [发明专利]语音消息的处理方法、装置及电子设备-CN202210750656.X在审
  • 许静 - 网易(杭州)网络有限公司
  • 2022-06-28 - 2022-11-18 - G10L15/26
  • 本发明提供了一种语音消息的处理方法、装置及电子设备,识别目标消息的语音内容,基于识别的语音内容,将目标消息划分为至少一段语音段落;响应针对至少一段语音段落中,第一语音段落的编辑操作,获取第一语音段落的更新语音段落;将第一语音段落替换为更新语音段落,得到编辑后的目标消息。该方法通过将目标消息识别为多个语音段落,使得用户可以针对每个语音片段进行编辑操作,录入对应的更新语音段落,从而对目标消息中的语音片段进行更改,提升了用户通过语音消息进行沟通的体验。
  • 语音消息处理方法装置电子设备
  • [发明专利]直播语音信息处理方法、装置、设备及存储介质-CN202210495214.5在审
  • 沈志铭 - 广州博冠信息科技有限公司
  • 2022-05-07 - 2022-10-25 - G10L15/02
  • 本发明涉及视频直播技术领域,公开了一种直播语音信息处理方法、装置、设备及存储介质。该方法包括:获取目标信号,并将目标信号转换至指定频域,得到目标信号的频域信号;从频域信号中提取目标信号的信号特征,并利用预置关键信号对应的特征参考模式,对信号特征进行模式匹配,得到目标信号和关键信号之间的第一匹配距离;对比第一匹配距离和预先设置的参考距离之间的大小,并基于对比的结果确定对目标信号的处理结果。本发明实现了直播过程中的语音自动化审核,提升了直播语音审核的效率以及执行审核行为的实时性。
  • 直播语音信息处理方法装置设备存储介质
  • [发明专利]一种语音识别方法及装置-CN201910130555.0有效
  • 潘嘉;魏思;王智国 - 科大讯飞股份有限公司
  • 2019-02-21 - 2022-01-04 - G10L15/02
  • 本申请公开了一种语音识别方法及装置,该方法包括:在获取到待识别的目标后,将从预先构建的记忆体中获取与目标匹配的表示信息,其中,记忆体中存储了大量的样本说话人表示结果和/或样本说话环境表示结果,进而,可以根据从记忆体中获取的表示信息,对目标进行识别。可见,由于记忆体中存储了大量的样本说话人表示结果和/或样本说话环境表示结果,所以,能够从记忆体中获取到与目标的说话人和/或说话环境相匹配的表示信息,用以丰富目标的识别依据,从而能够在对目标进行在线的个性化语音识别时,提高语音识别效果和效率。
  • 一种语音识别方法装置
  • [发明专利]一种语音识别方法、声学模型的训练方法、装置及设备-CN202210006570.6在审
  • 李思琪;付立 - 京东科技信息技术有限公司
  • 2022-01-04 - 2023-07-14 - G10L15/02
  • 本申请提供一种语音识别方法、声学模型的训练方法、装置及设备。该语音识别方法包括:接收语音识别请求,语音识别请求包括目标种的待识别语音;对待识别语音提取语音特征并输入第一声学模型,得到声学特征,声学特征包括待识别语音的可能性字符,第一声学模型是根据第一语音样本和第二语音样本,基于神经网络进行训练得到的用于识别语音数据中目标种的可能性字符的模型,第一语音样本包括人工标定的多个语音样本和对应的目标种的字符,第二语音样本包括采用第一语音样本训练的第二声学模型标定的多个语音样本和对应的目标种的字符;根据声学特征确定目标种的语音识别结果并输出。本申请的方法提高了目标种的语音识别准确度。
  • 一种语音识别方法声学模型训练装置设备
  • [发明专利]一种语音处理方法、装置及计算机可读存储介质-CN202111345799.4在审
  • 鲍枫 - 腾讯科技(深圳)有限公司
  • 2021-11-15 - 2023-05-16 - G10L21/0232
  • 本申请提出了一种语音处理方法、装置及计算机可读存储介质,可以应用于云技术、人工智能、区块链、车联网、智慧交通、智能家居等各种领域或场景,该方法包括:获取目标数据的语音特征;所述语音特征包括静态频域特征、动态频域特征、频谱斜率特征和频谱能量特征中的一种或多种;利用增益预测模型对所述目标数据的语音特征进行处理,得到所述目标数据的增益信息;所述增益预测模型是根据含噪语音数据的语音特征训练得到的;根据所述目标增益信息对所述目标数据进行增强处理,得到所述目标数据对应的增强语音数据。采用本申请实施例,可以高效、准确地对语音增强,提升语音降噪的效果。
  • 一种语音处理方法装置计算机可读存储介质
  • [发明专利]语音合成方法、装置、计算机设备及存储介质-CN201911368538.7有效
  • 劳振锋;肖纯智 - 广州酷狗计算机科技有限公司
  • 2019-12-26 - 2023-05-26 - G10L13/047
  • 本申请公开了一种语音合成方法、装置、计算机设备及存储介质,属于语音信号处理领域。方法包括:获取第一对象的原始语音;对原始语音进行语音识别,得到原始语音对应的原始发音序列,原始发音序列中包括原始语音中各个字词的原始字词发音;从目标字词库中获取原始字词发音对应的目标字词发音,目标字词库中存储有第二对象对各个字词的字词发音;对各个目标字词发音进行拼接,生成目标发音序列;根据目标发音序列合成目标目标具有第二对象的声音特征。采用本申请的语音合成方法,可直接利用第二对象的声音特征来实现合成目标,提高了语音合成的准确性,且目标具备原始语音的音高特征,使得目标呈现原始语音的流畅度。
  • 语音合成方法装置计算机设备存储介质
  • [发明专利]语音处理方法、装置、系统及存储介质-CN201911109001.9有效
  • 张银平;杨琳;汪俊杰;贾宸;梁玉龙 - 联想(北京)有限公司
  • 2019-11-13 - 2022-10-25 - G10L15/25
  • 本申请提供了一种语音处理方法、装置、系统及存储介质,在嘈杂的场景下,多媒体处理设备获取包含多个语音语音信息及视频界面展示的人脸图像后,通过对该人脸图像的嘴部区域进行追踪检测,得到相应的嘴部运行信息,由于不同嘴部运动信息对应的语音往往不同,所以,本申请可以据此直接从这多个语音信息中,提取与该嘴部运动信息匹配的目标信息,即提取处视频界面展示的发言人的目标,之后,通过增强目标的信号强度,增大该目标信息与其他语音信息(即噪声)之间的信号强度的差距,突出输出的目标信息,提高了嘈杂场景下识别目标信息的效率及准确性,保证收听者能够准确地得知发言人的发言内容。
  • 语音处理方法装置系统存储介质
  • [发明专利]语音处理方法、装置、计算机可读存储介质及计算机设备-CN202111620262.4在审
  • 孟廷;江源;宋锐 - 科大讯飞股份有限公司
  • 2021-12-28 - 2022-04-01 - G10L13/02
  • 本申请实施例公开了一种语音处理方法、装置、计算机可读存储介质及计算机设备。该方法包括:根据来自终端的语音合成服务请求,确定目标性能数据以及目标发音对象的语音数据,该语音数据具有目标音色,根据目标性能数据对初始语音合成模型中的目标网络模块进行裁剪处理,以得到待训练语音合成模型,并利用语音数据对待训练语音合成模型进行训练,得到目标合成模型,以使得终端利用目标合成模型对目标文本进行语音合成处理,得到具有目标音色的合成语音数据。本申请实施例可得到与终端的性能数据匹配的目标合成模型,从而基于该目标合成模型提供符合终端的目标性能数据的语音合成服务,改善用户体验。
  • 语音处理方法装置计算机可读存储介质设备
  • [发明专利]终端设备的语音控制方法和装置、存储介质及电子设备-CN202210302041.0在审
  • 郭延文 - 青岛海尔科技有限公司;海尔智家股份有限公司
  • 2022-03-25 - 2022-06-28 - G10L15/22
  • 本发明公开了一种终端设备的语音控制方法和装置、存储介质及电子设备。其中,该方法包括:在接收到目标的情况下,获取目标语音识别结果,其中,目标为终端设备网络采集到的语音数据;在语音识别结果表征目标属于设备控制类语音的情况下,开启目标异步线程,并基于语音识别结果对目标进行语义解析;利用目标异步线程调用设备列表服务,以通过设备列表服务获取终端设备列表,终端设备列表中包括位于终端设备网络中的终端设备的设备信息;根据语义解析结果从终端设备列表中查找出目标终端设备,并将与语义解析结果匹配的目标控制指令下发至目标终端设备本发明解决了设备列表调用耗时较长导致语音控制效率低的技术问题。
  • 终端设备语音控制方法装置存储介质电子设备
  • [发明专利]一种语音泛化方法、装置及计算机存储介质-CN202010820913.3在审
  • 孙中全 - 博泰车联网(南京)有限公司
  • 2020-08-14 - 2020-12-01 - G10L15/26
  • 本发明公开了一种语音泛化方法、装置及计算机存储介质,所述语音泛化方法包括:获取当前用户在历史对话中输入的至少一目标;其中,所述目标为识别失败的语音;确定所述目标满足预设泛化条件时,对所述目标进行泛化处理,以使所述目标能被识别成功。本发明提供的语音泛化方法、装置及计算机存储介质,通过搜集用户在历史对话中输入的语音,并在语音满足预设泛化条件时对语音进行泛化处理,以实现自动泛化用户语音,提高了语音泛化的及时性和效率,并提升了用户使用体验
  • 一种语音泛化方法装置计算机存储介质
  • [发明专利]语音转换方法、装置和电子设备-CN202111546962.3在审
  • 魏凌 - 维沃移动通信有限公司
  • 2021-12-16 - 2022-03-25 - G10L15/22
  • 本申请公开了一种语音转换方法、装置和电子设备,涉及终端领域。所述方法包括:接收第一输入;根据所述第一输入,确定目标消息;获取所述目标消息对应的目标文本;基于所述目标消息对应的目标文本和预先建立的目标库,确定所述目标文本对应的目标情感指示标识,所述目标情感指示标识用于反应所述目标消息对应的目标用户的情感;显示所述目标消息对应的目标结果,所述目标结果中包括所述目标文本和所述目标情感指示标识;其中,所述目标库中存储文本与情感指示标识之间的对应关系,所述文本与情感指示标识之间的对应关系是基于视频会话建立的
  • 语音转换方法装置电子设备

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

400-8765-105周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top