专利名称
主分类
A 农业
B 作业;运输
C 化学;冶金
D 纺织;造纸
E 固定建筑物
F 机械工程、照明、加热
G 物理
H 电学
专利下载VIP
公布日期
2023-10-24 公布专利
2023-10-20 公布专利
2023-10-17 公布专利
2023-10-13 公布专利
2023-10-10 公布专利
2023-10-03 公布专利
2023-09-29 公布专利
2023-09-26 公布专利
2023-09-22 公布专利
2023-09-19 公布专利
更多 »
专利权人
国家电网公司
华为技术有限公司
浙江大学
中兴通讯股份有限公司
三星电子株式会社
中国石油化工股份有限公司
清华大学
鸿海精密工业股份有限公司
松下电器产业株式会社
上海交通大学
更多 »
钻瓜专利网为您找到相关结果15个,建议您升级VIP下载更多相关专利
  • [发明专利]一种对语音信息的训练方法及装置-CN202011577644.9有效
  • 张旭;殷昊;陈云琳;江明奇;杨喜鹏 - 出门问问(武汉)信息科技有限公司
  • 2020-12-28 - 2023-08-01 - G06V10/44
  • 本发明公开了一种对语音信息的训练方法及装置,本发明实施例首先获取语音信息数据;并针对所述语音信息数据中的任一语音信息:对所述语音信息进行处理,得到梅尔频谱图序列;对所述梅尔频谱图序列进行语义特征提取,得到语义特征信息;对所述语义特征信息进行时序特征提取,得到时序特征信息;之后对多个所述时序特征信息进行模型训练,得到面部关键点模型。由此,通过对语音信息进行语义特征提取的学习,以及时序特征提取的学习,从而提升面部关键点模型的性能,使得面部关键点模型能够准确合成面部关键点序列,进而提高说话人视频的合成效果,从而解决现有技术中模型输出说话人画面出现的抖动问题。
  • 一种语音信息训练方法装置
  • [发明专利]声纹注册方法、装置、电子设备及存储介质-CN202211055446.5在审
  • 魏光辉;李志飞 - 出门问问(武汉)信息科技有限公司
  • 2022-08-31 - 2023-03-21 - G10L15/04
  • 本公开提供了一种声纹注册方法、装置、电子设备及存储介质。本公开实施例的声纹注册方法可以包括:将第一说话人的语音样本切分为长度相同的多条语音段;将每条语音段切分为长度相同且彼此重叠的多个语音帧;获取每条语音段中每个语音帧的声纹识别特征,并根据语音段中所有语音帧的声纹识别特征获取语音段的声纹嵌入码;确定语音样本中每条语音段的声纹嵌入码与其他语音段的声纹嵌入码的相似度;根据每条语音段的声纹嵌入码的所有相似度和预设的相似度阈值确定有效的声纹嵌入码;根据语音样本对应的所有有效的声纹嵌入码获得第一说话人的注册声纹嵌入码。本公开可以实现无效音频部分的自检查和有效提取,使得注册声纹嵌入码能够更加准确地表示说话人的语音特征。
  • 声纹注册方法装置电子设备存储介质
  • [发明专利]语音识别方法、装置、电子设备及存储介质-CN202211057400.7在审
  • 魏光辉;李志飞 - 出门问问(武汉)信息科技有限公司
  • 2022-08-31 - 2022-11-29 - G10L15/04
  • 本公开提供了一种语音识别方法、装置、电子设备及存储介质。本公开的一种语音识别方法包括:将待识别语音切分为长度相同的多条语音段;以及,通过如下方式获取每条所述语音段的说话人:将语音段切分为长度相同且彼此重叠的多个语音帧;获取所述语音段中每个所述语音帧的声纹识别特征;根据所述语音段中所有语音帧的声纹识别特征获取所述语音段的声纹嵌入码;根据所述语音段的声纹嵌入码和预注册声纹嵌入码,确定所述语音段的说话人。本公开实施例不仅可以有效去除无效音频段落对整个音频说话人识别的影响,从而准确识别出语音的说话人,同时还可鉴别语音质量,识别出人声指令较佳的语音和人声质量欠佳的语音。
  • 语音识别方法装置电子设备存储介质
  • [发明专利]一种语音识别路径规划方法、系统及平台-CN202011627783.8在审
  • 汪剑;雷欣;李志飞 - 出门问问(武汉)信息科技有限公司
  • 2020-12-31 - 2021-05-18 - G01C21/36
  • 本发明公开了一种语音识别路径规划方法、系统及平台,属于语音信息处理,该方法包括:获取原始语音信息,调用预先训练得到的特征提取模型,提取音频序列特征;基于预测候选集,识别音频序列特征,并得到对应的序列信息表示;调用预先训练得到的语音识别模型,根据序列信息表示,结合当前对应的状态信息,选取当前位置出发收益期望值最高的路径作为路径规划中的下一条路径;调用深度强化网络智能体,完成序列路径决策,得到并输出解析路径信息。通过实施本发明披露的技术方案能够将语音序列信息的高层表示构建和语音识别的路径构建进行统一训练优化,避免了两者之间差异性造成的影响。
  • 一种语音识别路径规划方法系统平台
  • [发明专利]一种获取语音识别模型训练数据的方法及装置-CN202011576869.2在审
  • 张彬彬;杨超;陈晓宇;曾晨晨 - 出门问问(武汉)信息科技有限公司
  • 2020-12-28 - 2021-05-14 - G10L15/22
  • 本发明公开了一种获取语音识别模型训练数据的方法及装置,该方法包括:获取视频流中的第t帧图像;当第t帧图像包括第一字幕区域,获取视频流中的第t+1帧图像,并从第t+1帧图像中确定与第一字幕区域的位置坐标相同的区域作为第二字幕区域;当第二字幕区域与第一字幕区域的相似度大于或等于预设阈值,以步长为1,依次获取视频流中的第t+2、第t+3…第t+n帧图像,直到第t+n帧图像对应的第n+1字幕区域与第t+n‑1帧图像对应的第n字幕区域的相似度小于预设阈值,并计算第t帧图像至第t+n‑1帧图像之间的时间段;提取视频流中时间段的语音,得到语音数据;对第一字幕区域至第n字幕区域中的任意一个字幕区域进行文本识别,得到与语音数据对应的标注文本数据。
  • 一种获取语音识别模型训练数据方法装置
  • [发明专利]语音识别方法及装置-CN202011519104.5在审
  • 张彬彬;吴迪;雷欣;李志飞 - 出门问问(武汉)信息科技有限公司
  • 2020-12-21 - 2021-05-14 - G10L15/22
  • 公开了一种语音识别方法及装置。该方法应用于电子设备,所述电子设备包括流式语音识别模型,所述流式语音识别模型包括:CTC模型和Transformer模型,该方法包括:接收语音信息;对所述语音信息进行编码,生成编码序列;当所述编码序列中除最后一个元素外的任一元素生成时,利用CTC模型对所述元素进行识别,生成中间识别结果;输出所述中间识别结果;利用Transformer模型对所述编码序列进行识别,生成最终识别结果;输出所述最终识别结果。
  • 语音识别方法装置
  • [发明专利]一种基于语言模型进行运算的训练方法及装置-CN202011621097.X在审
  • 张旭;雷欣;李志飞 - 出门问问(武汉)信息科技有限公司
  • 2020-12-31 - 2021-05-07 - G06F40/126
  • 本发明公开了一种基于语言模型进行算术运算的训练方法及装置,该方法包括在算式文本中每个字符前添加空格字符,生成准算式文本;对所述准算式文本进行分词处理,得到与所述准算式文本对应的列表,所述列表中包括多个词;将与所述准算式文本对应的列表作为训练样本,得到训练样本数据;利用语言模型对所述训练样本数据进行运算训练,生成算术模型。由此,通过添加空格字符和分词处理的方式对算式文本进行预处理,从而使得算式文本中每一个字符作为单独的词输入语言模型,语言模型能够对算式文本的每个字符和每个字符的数位信息进行学习,进而实现了在对语言模型采用少量训练样本训练后便可以有效提高训练后算术模型计算的准确率。
  • 一种基于语言模型进行运算训练方法装置
  • [发明专利]一种穿戴设备及其显示模组-CN202011537580.X在审
  • 李永坡;王葆麟;李清亮;宋彪 - 出门问问(武汉)信息科技有限公司
  • 2020-12-23 - 2021-03-19 - G04B39/00
  • 本发明公开了一种穿戴设备及其显示模组,显示模组包括玻璃层;触摸层,贴合在玻璃层的一侧;LCD显示层,贴合在触摸层的远离玻璃层的一侧,且LCD显示层与玻璃层之间共同形成有环形容纳部;装饰圈,设置于LCD显示层与玻璃层之间,并部分容纳于环形容纳部内,且装饰圈能够与穿戴设备的主体部连接,以将显示模组安装在穿戴设备上。该显示模组自带装饰圈,在与穿戴设备进行装配时,可直接将装饰圈粘贴在穿戴设备的主体部上,从而避免了将显示模组分开成两部分再进行装配的过程,进而提高了显示模组装配的便利性。此外,该显示模组无需考虑装饰圈与显示模组的装配问题,具有更大的设计空间,以适应不同用户的使用需求。
  • 一种穿戴设备及其显示模组

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

400-8765-105周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top