专利名称
主分类
A 农业
B 作业;运输
C 化学;冶金
D 纺织;造纸
E 固定建筑物
F 机械工程、照明、加热
G 物理
H 电学
专利下载VIP
公布日期
2023-10-24 公布专利
2023-10-20 公布专利
2023-10-17 公布专利
2023-10-13 公布专利
2023-10-10 公布专利
2023-10-03 公布专利
2023-09-29 公布专利
2023-09-26 公布专利
2023-09-22 公布专利
2023-09-19 公布专利
更多 »
专利权人
国家电网公司
华为技术有限公司
浙江大学
中兴通讯股份有限公司
三星电子株式会社
中国石油化工股份有限公司
清华大学
鸿海精密工业股份有限公司
松下电器产业株式会社
上海交通大学
更多 »
钻瓜专利网为您找到相关结果72个,建议您升级VIP下载更多相关专利
  • [发明专利]文本识别方法及相关装置、设备和存储介质-CN202310692381.3在审
  • 胡金水;刘辰宇;晏黔东;朱旭阳;吴嘉嘉;殷兵;殷保才;刘聪 - 科大讯飞股份有限公司
  • 2023-06-09 - 2023-10-24 - G06V30/19
  • 本申请公开了一种文本识别方法及相关装置、设备和存储介质,其中,文本识别方法包括:提取待识别图像的图像特征;基于图像特征执行如下第一解码操作:基于上一解码时刻的解码信息,从图像特征提取得到当前解码时刻的第一视觉特征;并基于当前解码时刻的第一视觉特征及上一解码时刻的解码信息,得到当前解码时刻的语言特征;及基于第一视觉特征和语言特征进行解码,得到当前解码时刻的解码字符;其中,解码信息包括解码字符、解码状态中至少一者,组合各个解码时刻的解码字符得到第一解码操作的候选识别文本;基于若干种解码操作各自的候选识别文本,得到待识别图像的目标识别文本。上述方案,能够提升文本识别的准确性,特别是在OOV上的准确性。
  • 文本识别方法相关装置设备存储介质
  • [发明专利]图像处理方法、装置、设备及存储介质-CN202310798362.9在审
  • 程虎;殷兵;殷保才;林垠;刘文超 - 科大讯飞股份有限公司
  • 2023-06-29 - 2023-10-13 - G06V10/75
  • 本申请提供了图像处理方法、装置、设备及存储介质,具体实现方案为:获取第一图像中的各个图形元素的属性信息,所述各个图形元素构成所述第一图像中的第一图形对象,根据所述第一图像中的各个图形元素的属性信息,确定所述第一图形对象的图结构信息,以及,获取第二图像中的第二图形对象的图结构信息;至少根据所述第一图形对象的图结构信息,以及所述第二图形对象的图结构信息,从所述第二图形对象中确定出与所述第一图形对象匹配的图形区域。根据本申请的技术方案,能够有效提升拼图图像匹配的准确性。
  • 图像处理方法装置设备存储介质
  • [发明专利]文图生成方法、装置、设备及存储介质-CN202310865239.4在审
  • 殷保才;何山;殷兵;刘聪 - 科大讯飞股份有限公司
  • 2023-07-13 - 2023-10-10 - G06T11/60
  • 本申请公开了一种文图生成方法、装置、设备及存储介质,本申请借助大语言模型的语言能力,令大语言模型执行对原始文本描述内容进行加工处理的任务,该任务为使得大语言模型所得到的编辑后文本描述内容相对于原始文本描述内容的丰富度更高的任务,获取大语言模型输出层所提取的文本表征,该文本表征可以作为大语言模型输出的编辑后文本描述内容对应的特征表示,由于编辑后文本描述内容相对于原始文本描述内容的信息丰富度更高,因此获取的输出层所提取的文本表征相对于传统对原始文本描述内容的编码特征,其特征表达能力更强,将该文本表征送入预配置的文图生成模型,得到模型生成图像,该生成图像与文本内容更加匹配,也即图像效果更佳。
  • 生成方法装置设备存储介质
  • [发明专利]一种情感识别方法、装置、存储介质及设备-CN202310651876.1在审
  • 殷兵;奚昌凤;殷保才 - 科大讯飞股份有限公司
  • 2023-06-01 - 2023-08-18 - G06V40/70
  • 本申请公开了一种情感识别方法、装置、存储介质及设备,该方法包括:首先获取待识别的目标视频,其中,目标视频为缺少目标模态信号的视频,然后提取目标视频中非目标模态信号的信号特征,并对该非目标模态信号的信号特征进行解码,生成目标模态信号;接着,提取目标模态信号的信号特征,并利用该目标模态信号或非目标模态信号,生成目标视频对应的文本特征;进而可以根据目标模态信号的信号特征、非目标模态信号的信号特征以及文本特征,对目标视频中的目标用户进行情感识别,得到目标用户对应的情感识别结果。可见,由于本申请的识别依据更加准确,从而能够进一步提高最终情感识别结果的准确率。
  • 一种情感识别方法装置存储介质设备
  • [发明专利]知识问答方法、装置、设备及存储介质-CN202310506317.1在审
  • 刘权;殷兵;殷保才;丁瑞;刘文超;胡国平;刘聪;高建清;魏思;王士进 - 科大讯飞股份有限公司
  • 2023-05-05 - 2023-08-08 - G06F16/332
  • 本申请公开了一种知识问答方法、装置、设备及存储介质,方法包括:获取用户输入的图片及与图片相关的问题文本,获取图片的描述信息,并将描述信息作为问答知识提供给大语言模型,使得大语言模型能够理解图片中的图像内容,将其作为知识问答对话的上下文信息,在此基础上,将用户输入的问题文本作为提示指令输入给大语言模型,大语言模型能够基于前述理解的图片中的图像内容,对该问题文本进行理解及回复。本申请支持多模态的问题输入,用户可以基于图片进行知识问答,扩展了知识问答的应用场景。并且,按照本申请的方案可以使得大语言模型能够理解图片的图像内容,基于此能够更加准确的给出问题文本所匹配的答复内容。
  • 知识问答方法装置设备存储介质
  • [发明专利]知识问答方法、装置、设备及存储介质-CN202310506333.0在审
  • 殷兵;刘聪;高建清;殷保才;丁瑞;刘文超;胡国平;魏思;王士进;刘权 - 科大讯飞股份有限公司
  • 2023-05-05 - 2023-08-08 - G06F16/332
  • 本申请公开了一种知识问答方法、装置、设备及存储介质,方法包括:获取用户输入的图片及与图片相关的问题文本,对识别图片中包含的文本信息,并将文本信息作为问答知识提供给大语言模型,使得大语言模型能够理解图片中包含的文本信息,将其作为知识问答对话的上下文信息,在此基础上,将用户输入的问题文本作为提示指令输入给大语言模型,大语言模型能够基于前述理解的图片中包含的文本信息,对该问题文本进行理解及回复。本申请支持多模态的问题输入,用户可以基于图片进行知识问答,扩展了知识问答的应用场景。并且,按照本申请的方案可以使得大语言模型能够理解图片中包含的文本信息,基于此能够更加准确的给出问题文本所匹配的答复内容。
  • 知识问答方法装置设备存储介质
  • [发明专利]一种人脸识别方法、系统及装置-CN202310295775.5在审
  • 吴子扬;奚昌凤;殷保才 - 科大讯飞股份有限公司
  • 2023-03-22 - 2023-07-25 - G06V40/16
  • 本申请公开了一种人脸识别方法、系统及装置,该方法包括:基于人脸识别模型进行人脸识别,得到待识别图像对应的人脸图像特征;模型训练过程包括:构建包含多个样本图像的训练样本集,将样本图像输入人脸识别模型,获得对应的初始图像特征;将初始类别特征的初始值处理为简化值,得到简化类别特征,将初始图像特征的初始值处理为简化值,得到简化图像特征;获得简化图像特征和各个简化类别特征之间的第一相似度,基于第一相似度从所有初始类别特征中获得样本图像对应的多个参考类别特征;基于所有样本图像对应的类别标签、初始图像特征和参考类别特征,调整人脸识别模型中的参数。通过上述方式,本申请能够提高人脸识别准确率,并节省计算成本。
  • 一种识别方法系统装置
  • [发明专利]人体指向确定、屏幕控制方法、装置及相关设备-CN202310180797.7有效
  • 张杰;殷保才;张圆;李华清 - 科大讯飞股份有限公司
  • 2023-03-01 - 2023-07-25 - G06V40/10
  • 本申请公开了一种人体指向确定、屏幕控制方法、装置及相关设备,本申请同时获取对人体拍摄的目标图像以及深度点云数据,提取目标图像的人体掩码特征,以及提取深度点云数据的深度点云特征,基于人体掩码特征对深度点云特征进行处理,得到深度补全特征,基于深度补全特征确定人体指向点信息。本申请在传统的基于人体深度点云数据进行人体指向估计的基础上,额外考虑了对人体拍摄的目标图像,利用该目标图像的人体掩码特征对深度点云特征进行处理,得到的深度补全特征相比于单纯从深度点云数据中提取的深度点云特征,其包含的信息更加丰富,进而可以更加准确的估计人体指向点信息,提升了人体指向点信息的准确性。
  • 人体指向确定屏幕控制方法装置相关设备
  • [发明专利]一种交互方法及相关设备和系统-CN202310284388.1在审
  • 叶润春;林垠;殷保才;殷兵 - 科大讯飞股份有限公司
  • 2023-03-20 - 2023-06-23 - G06F3/01
  • 本发明提供了一种交互方法及相关设备和系统,其中,交互方法包括:获取交互区域的多模态信息,多模态信息包括基于多个终端设备中的部分或全部终端设备获取的相对应的图像信息和语音信息;基于多模态信息中的图像信息确定交互区域中是否存在目标用户;若是,则基于多模态信息中的图像信息确定目标用户是否朝向多个终端设备中的一终端设备;若是,则将目标用户朝向的终端设备确定为交互设备;基于多模态信息中的语音信息,确定交互设备对应的控制指令,并向交互设备发送对应的控制指令。本发明提供的交互方法通过有效利用基于多个终端设备获取的多模态信息,使得语音交互不需要唤醒词,如此,整个交互过程更加自然高效。
  • 一种交互方法相关设备系统
  • [发明专利]人脸跟踪方法、装置、电子设备及存储介质-CN202310074684.9在审
  • 张亚峰;林垠;李超龙;沙文;殷保才 - 科大讯飞股份有限公司
  • 2023-01-16 - 2023-05-02 - G06T7/246
  • 本发明提供一种人脸跟踪方法、装置、电子设备及存储介质,所述方法包括:获取视频帧序列中的当前帧,并判断所述当前帧的类型;若所述当前帧是检测帧,则对所述检测帧进行人脸检测,并根据人脸检测的结果进行不同处理,包括:未检出人脸时根据人脸关键点信息执行相似度计算,以及检出人脸时根据深度信息选择最优人脸;若所述当前帧是跟踪帧,则对所述跟踪帧进行人脸标定,并根据人脸标定的结果对当前帧的人脸关键点信息和上一帧的人脸关键信息的相似度计算;当所述检测帧或所述跟踪帧执行相似度计算的结果满足第一预设要求时,获取跟踪框以执行跟踪操作。由于引入了相似度和人脸区域深度信息,使得本发明即使在复杂的场景下,也能实现正确跟踪。
  • 跟踪方法装置电子设备存储介质

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

400-8765-105周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top