专利名称
主分类
A 农业
B 作业;运输
C 化学;冶金
D 纺织;造纸
E 固定建筑物
F 机械工程、照明、加热
G 物理
H 电学
专利下载VIP
公布日期
2023-10-24 公布专利
2023-10-20 公布专利
2023-10-17 公布专利
2023-10-13 公布专利
2023-10-10 公布专利
2023-10-03 公布专利
2023-09-29 公布专利
2023-09-26 公布专利
2023-09-22 公布专利
2023-09-19 公布专利
更多 »
专利权人
国家电网公司
华为技术有限公司
浙江大学
中兴通讯股份有限公司
三星电子株式会社
中国石油化工股份有限公司
清华大学
鸿海精密工业股份有限公司
松下电器产业株式会社
上海交通大学
更多 »
钻瓜专利网为您找到相关结果885745个,建议您升级VIP下载更多相关专利
  • [发明专利]一种进线请求处理方法、装置及电子设备-CN202110643784.X有效
  • 程尧 - 中国银行股份有限公司
  • 2021-06-09 - 2023-01-20 - H04M3/493
  • 本发明提供了一种进线请求处理方法、装置及电子设备,在检测到进线请求的情况下,获取生成进线请求的目标用户的身份信息,并确定与所述身份信息对应的发音标准程度值,在确定出所述发音标准程度值小于第一预设阈值的情况下,说明用户发音标准程度较差,此时调用IVR按键导航功能处理所述进线请求,用户仅需按键即可确定业务,不需要语音交互,进而能够避免由于发音不标准而带来的无法确定要处理的业务,使得业务办理效率低的问题,保证了用户能够正常办理业务
  • 一种请求处理方法装置电子设备
  • [发明专利]一种语音处理方法、装置和电子设备-CN202010301719.4在审
  • 李栋梁;刘恺;周明;陈伟 - 北京搜狗科技发展有限公司
  • 2020-04-16 - 2021-10-22 - G10L13/08
  • 本发明实施例提供了一种语音处理方法、装置和电子设备,其中,所述方法包括:获取待转换的文本信息,以及确定所述文本信息对应的源语种和待转换的目标用户;依据所述文本信息和所述目标用户对应的目标转换模型,将所述文本信息转换为目标用户采用源语种发音目标语音数据;其中,所述目标转换模型依据目标用户发音的单语种语音数据对训练后的通用转换模型进行自适应训练,所述通用转换模型依据包含N种语种的语音数据进行训练;所述源语种为所述N种语种中的一种,N为大于1的整数;进而能够在只有目标用户单一语种的语音数据情况下,将多语种的文本转为对应语种的目标用户的目标语音数据,实现多语种的语音转换。
  • 一种语音处理方法装置电子设备
  • [发明专利]文本纠错处理方法、装置、电子设备及可读存储介质-CN202310105534.X在审
  • 胡勇 - 腾讯科技(深圳)有限公司
  • 2023-01-20 - 2023-10-27 - G06F40/30
  • 本申请提供了一种文本纠错处理方法、装置、电子设备及可读存储介质;方法包括:获取目标文本;确定所述目标文本中每个目标字符的语义特征向量,并确定所述每个目标字符的发音特征向量;对所述每个目标字符的语义特征向量和发音特征向量进行融合处理,得到所述每个目标字符的字符特征向量;基于所述每个目标字符的字符特征向量进行编码处理,得到所述每个目标字符的上下文特征向量;将所述每个目标字符的上下文特征向量映射为字表中每个候选字符的概率,将最大概率的候选字符作为纠错字符,基于所述每个目标字符对应的纠错字符组合形成纠错文本。
  • 文本纠错处理方法装置电子设备可读存储介质
  • [发明专利]中英文混合识别方法、装置和计算机设备-CN202210477795.X在审
  • 王伟戌;王强强;商迎新;付涛;李超凡 - 北京云思智学科技有限公司
  • 2022-04-28 - 2022-09-27 - G10L15/00
  • 本发明提供一种中英文混合识别方法,包括:获取待识别的语音信号,所述待识别的语音信号中包含中文字符和/或英文字符,通过中英文识别模型处理所述语音信号,获取所述语音信号对应的发音序列,所述发音序列中包含中文字符的发音特征和/或英文字符的发音特征,基于所述中文字符的发音特征和/或英文字符的发音特征,从发音字典匹配至少一个候选文本,通过语言模型处理所述至少一个候选文本,获取所述至少一个候选文本的概率,根据所述至少一个候选文本的概率,确定所述语音信号对应的目标文本,以此方式实现通过中英文识别模型可以识别混合语种的语音信号,并基于语音模型可以从候选文本中快速准确的确定出与该语音信号匹配较高的文本数据。
  • 中英文混合识别方法装置计算机设备
  • [发明专利]虚拟形象唇形驱动方法、装置、介质及电子设备-CN202310108970.2在审
  • 毕成;马泽君 - 北京有竹居网络技术有限公司
  • 2023-01-31 - 2023-05-16 - G06T13/40
  • 方法包括:确定目标文本对应的目标IPA序列和该序列中各音标的发音时长;根据每一发音时长,对目标IPA序列进行时长扩展,得到扩展序列;针对扩展序列中的每一音标,从扩展序列中提取包含该音标的N‑gram音标串,得到目标音标序列;根据参考音标序列与唇形参数的对应关系,确定与目标音标序列相匹配的唇形参数;基于该音标对应的唇形参数,对目标虚拟形象进行唇形渲染。在获取扩展序列中的每一目标音标对应的唇形参数时,同时考虑目标音标本身和其上下文信息,可使得不同IPA组合下的唇形参数更符合真实面部情况,使得目标虚拟形象的唇形尽可能逼真,提升动画效果。
  • 虚拟形象驱动方法装置介质电子设备
  • [发明专利]一种语音合成方法及装置-CN202010872280.0在审
  • 洪林;苏少炜;常乐 - 北京声智科技有限公司
  • 2020-08-26 - 2020-11-24 - G10L13/02
  • 本发明提供一种语音合成方法及装置,该方法包括:获取待处理文本,以及获取目标语音合成参数,其中,所述目标语音合成参数包括发音对象和发音参数中的至少一项;对所述待处理文本进行拆分,得到至少两段文本;通过与所述目标语音合成参数对应的语音合成模型本发明实施例通过获取待处理文本和目标语音合成参数,并对待处理文本进行拆分,以及通过与目标语音合成参数对应的语音合成模型,对拆分的多段文本进行语音合成,从而不仅能够合成具备目标语音合成参数的合成语音,还能保证语音合成的实效性
  • 一种语音合成方法装置
  • [发明专利]一种错误反馈方法、装置、设备及可读存储介质-CN202010663079.1在审
  • 王永杰 - 上海流利说信息技术有限公司
  • 2020-07-10 - 2022-01-11 - G09B7/02
  • 本发明公开了一种错误反馈方法、装置、设备及计算机可读存储介质,该方法包括:获取与题目对应的音频数据;在音频数据中确定与题目中的目标知识点对应的目标音频数据;判断目标音频数据是否正确;若目标音频数据不正确,则确定目标音频数据的错误类型,根据错误类型反馈纠正信息;该方法使纠正信息与错误类型相匹配,而错误类型为目标音频数据的错误类型,音频数据与用户发出的声音相对应,因此反馈的纠正信息可以对用户的具体错误情况进行纠正,使用户了解与正确发音之间的差异在哪儿,如何纠正差异,进而有效地提升用户的发音能力,纠正效果较好。
  • 一种错误反馈方法装置设备可读存储介质
  • [发明专利]发音对象识别、会议中的说话人识别方法以及装置-CN202211675795.7在审
  • 陈亚峰;郑斯奇;王绘;程路遥 - 阿里巴巴达摩院(杭州)科技有限公司
  • 2022-12-26 - 2023-05-30 - G10L17/04
  • 本说明书实施例提供发音对象识别、会议中的说话人识别方法以及装置,其中发音识别方法包括:获取待识别的语音数据;将语音数据输入预先训练的声纹识别模型,确定语音数据对应的目标发音对象,该声纹识别模型为利用无标签语音样本对指定模型进行自监督训练得到,自监督训练中采用的损失包括第一损失和第二损失,第一损失基于同一批次的多个无标签语音样本分别对应的发音对象的特征差异确定,第二损失基于无标签语音样本对应的发音对象的对象特征确定。如此,使用无标签语音样本对模型进行自监督训练,降低了数据成本和人力成本,提高了模型训练的效率,并且能够确保同一批次的不同发音对象的对象特征的多样性,降低了模型坍塌问题出现的可能性。
  • 发音对象识别会议中的说话方法以及装置

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

400-8765-105周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top