专利名称
主分类
A 农业
B 作业;运输
C 化学;冶金
D 纺织;造纸
E 固定建筑物
F 机械工程、照明、加热
G 物理
H 电学
专利下载VIP
公布日期
2023-10-24 公布专利
2023-10-20 公布专利
2023-10-17 公布专利
2023-10-13 公布专利
2023-10-10 公布专利
2023-10-03 公布专利
2023-09-29 公布专利
2023-09-26 公布专利
2023-09-22 公布专利
2023-09-19 公布专利
更多 »
专利权人
国家电网公司
华为技术有限公司
浙江大学
中兴通讯股份有限公司
三星电子株式会社
中国石油化工股份有限公司
清华大学
鸿海精密工业股份有限公司
松下电器产业株式会社
上海交通大学
更多 »
钻瓜专利网为您找到相关结果383396个,建议您升级VIP下载更多相关专利
  • [发明专利]视频问答的交互方法及系统-CN202110069976.4有效
  • 刘静;王卫宁;刘飞;卢汉清 - 中国科学院自动化研究所
  • 2021-01-19 - 2022-08-19 - G06F16/33
  • 本发明涉及一种视频问答的交互方法及系统,所述交互方法包括:从待处理的原始视频及与问题文本中,得到文本特征以及各帧图像中多个目标的第一视觉特征及第一语义特征;针对每帧图像中的每一目标,根据文本特征以及目标的第一视觉特征及第一语义特征,确定目标的第二视觉特征及第二语义特征;根据文本特征、目标的第二视觉特征及第二语义特征,得到该帧图像的第一全局视觉表示及第一全局语义表示;根据文本特征及各帧图像的第一全局视觉表示及第一全局语义表示,得到各帧图像的全局视觉表示;根据文本特征及各帧图像的全局视觉表示,得到原始视频的全局视觉特征表示;根据所述全局视觉特征表示及文本特征,可准确得到所述原始视频的问题答案。
  • 视频问答交互方法系统
  • [发明专利]相册的视觉表示-CN201680066429.8有效
  • D·J·李;R·普罗洛戈;A·哈托尔;J·德布纳;B·J·史密斯 - 微软技术许可有限责任公司
  • 2016-11-04 - 2022-04-12 - G06V40/16
  • 描述了用于选择相册的代表性相片的系统和方法。一种示例计算设备可包括:显示器,逻辑设备,以及存储指令的存储设备,所述指令能由所述逻辑设备执行以对于在所述相册的一个或多个相片中识别出的每一已知个体,确定该已知个体的密切关系分数,所述密切关系分数指示该已知个体与a)所述计算设备的用户以及b)对应于所述相册的上下文的联系。所述指令可进一步可执行以基于所述密切关系分数选择一个或多个已知个体以包括在所述相册的一个或多个相片中识别出的所述已知个体的子集中,以及选择所述已知个体的所述子集中的每一者的代表性相片以包括在所述相册的突出显示相片集和封面相片中的一者或多者中。
  • 相册视觉表示
  • [发明专利]自动生成视觉表示-CN201080033128.8有效
  • K·S·佩雷兹;A·基普曼;N·D·伯顿;A·威尔逊 - 微软公司
  • 2010-07-27 - 2012-05-23 - A63F13/00
  • 自动生成目标的视觉表示的技术可以减少或消除生成目标的视觉表示所需要的手动输入。例如,具有捕捉设备的系统可在物理空间中检测用户的各个特征,并且基于所检测到的特征从视觉表示特征选项库中作出特征选择。系统可以基于所检测到的特征自动地将选择应用于用户的视觉表示。或者,系统可以作出选择,该选择缩减了用户从中选择特征的选项的数量。系统可以实时地将选择应用于用户,以及实时地对所选择的和被应用到目标的视觉表示的特征进行更新。
  • 自动生成视觉表示
  • [发明专利]面向开放场景的多模态视觉目标检索方法与系统-CN202211088228.1在审
  • 高跃;丰一帆;吉书仪;刘玉身 - 清华大学
  • 2022-09-07 - 2023-06-23 - G06F16/535
  • 本申请涉及一种面向开放场景的多模态视觉目标检索方法与系统,包括:生成视觉对象的多模态表示数据,将多模态表示数据投影到视觉对象的紧凑隐空间,得到视觉对象的紧凑表示数据;基于紧凑表示数据构建超图结构,通过超图结构学习开放类别和已知类别的高阶关联表示;基于高阶关联表示,通过预设的典型表示记忆模块生成未知类别的嵌入表示数据,利用预设的已知类别训练模型将未知类别的嵌入表示数据应用于开放场景下的视觉目标检索,得到未知类别的视觉对象。由此,解决了由于原始数据格式和学习网络设计不同,造成天然的语义鸿沟,且相关技术的检索方法无法预知未知类别的物体等问题,克服了不同模态表示的语义鸿沟,能推测未知类别的嵌入表示
  • 面向开放场景多模态视觉目标检索方法系统
  • [发明专利]视觉问答处理方法、视觉问答模型的训练方法及装置-CN202310275875.1有效
  • 袁正;谭传奇;苑洪意;黄非;黄松芳 - 阿里巴巴达摩院(杭州)科技有限公司
  • 2023-03-15 - 2023-08-01 - G06F16/332
  • 本申请实施例公开了一种视觉问答处理方法、视觉问答模型的训练方法及装置,涉及人工智能技术领域。主要技术方案包括:获取包括待预测图像和问题文本的待预测视觉数据;从预先构建的视觉问答资源库中获取与待预测视觉数据相关的参考资源;将待预测视觉数据和参考资源提供给基于深度学习模型预先训练得到的视觉问答模型,视觉问答模型对待预测视觉数据和参考资源进行特征提取,得到待预测图像的第一特征表示、各参考图像的第一特征表示、问题文本的第一特征表示以及各参考文本的第一特征表示,再进行融合处理,得到待预测视觉数据的融合特征表示;利用待预测视觉数据的融合特征表示,生成针对问题文本的答案文本。本申请能够提高视觉问答的效果。
  • 视觉问答处理方法模型训练装置
  • [发明专利]一种视觉表示迁移方法及装置-CN202211641452.9在审
  • 尤国良;张燕咏;吉建民 - 中国科学技术大学
  • 2022-12-20 - 2023-07-25 - G06V10/77
  • 本申请公开了一种视觉表示迁移方法及装置,方法包括:获得使用近段策略优化算法训练得到的预训练模型,预训练模型应用于第一环境,预训练模型能够识别第一环境的第一视觉表示特征;基于第一视觉表示特征在第二环境中进行提示编码器的学习,提示编码器用于将第二环境的第二视觉表示特征转换为第一视觉表示特征;基于提示编码器将第二环境的第二视觉表示特征转换为预训练模型能够识别的第一视觉表示特征。上述方案使得预训练模型能够在新环境中快速学习到提示编码器,从而实现高效的视觉表示迁移和策略迁移,能够将预训练模型转移到需要解决相同基础问题但视觉输入不同的新环境,降低新环境重新进行模型训练的代价。
  • 一种视觉表示迁移方法装置
  • [发明专利]一种基于自适应聚类学习的视觉关系检测方法-CN201911341230.3有效
  • 刘安安;王彦晖;徐宁;聂为之 - 天津大学
  • 2019-12-23 - 2023-08-04 - G06F16/55
  • 本发明公开了一种基于自适应聚类学习的视觉关系检测方法,包括:从输入图像中检测视觉实体并通过上下文信息传递机制识别视觉实体,获得视觉实体上下文表征;将成对视觉实体上下文表征统一低维嵌入联合子空间中,获取视觉关系共享表示特征;将成对视觉实体上下文表征分别低维嵌入多个不同聚类子空间中,获取多个初步视觉关系增强表示特征;通过聚类驱动的注意力机制对不同聚类子空间的多个初步视觉关系增强表示特征进行正则化;将视觉关系共享表示特征,正则化后的视觉关系增强表示特征与视觉关系谓词类别标签的先验条件分布融合,对视觉关系谓词进行综合关系推理。本发明通过潜在关联挖掘对不同子类的视觉关系进行细粒度识别,提高了视觉关系检测的精度。
  • 一种基于自适应学习视觉关系检测方法
  • [发明专利]跨模态视觉对象检索方法及装置-CN202210457097.3在审
  • 高跃;丰一帆;闫循石 - 清华大学
  • 2022-04-27 - 2022-09-20 - G06V10/40
  • 本申请涉及立体视觉对象跨模态检索技术领域,特别涉及一种跨模态视觉对象检索方法及装置,其中,方法包括:获取待查询立体视觉对象的多模态表示;将多模态表示输入至预先训练的模型中,得到待查询立体视觉对象在预设特征空间下的特征表示;计算特征表示与预设特征表示之间的距离,并利用距离输出待查询立体视觉对象的最终检索列表。由此,解决了相关技术中未能充分利用同一物体不同模态表示间的关联性和互补性,从而无法训练不同模态的表示映射到同一表示空间的投影矩阵,降低了跨模态视觉对象检索的性能精度等问题。
  • 跨模态视觉对象检索方法装置
  • [发明专利]一种基于动态融合机制的多模态词汇表示方法-CN201710577334.9有效
  • 王少楠;张家俊;宗成庆 - 中国科学院自动化研究所
  • 2017-07-14 - 2020-02-07 - G06F16/36
  • 本发明的多模态词汇表示方法包括分别计算待表示词汇在文本模态中的文本表示向量、以及待表示词汇在视觉模态中的图片表示向量;将文本表示向量输入预先建立的文本模态权重模型,得到文本表示向量在文本模态中的权重;将图片表示向量输入预先建立的视觉模态权重模型,得到图片表示向量在图片模态中的权重;根据文本表示向量、图片表示向量以及分别与文本表示向量和图片表示向量对应的权重,计算得到多模态词汇表示向量。其中,文本模态权重模型为输入为文本表示向量、输出为文本表示向量在对应文本模态中的权重的神经网络模型;视觉模态权重模型为输入为图片表示向量、输出为图片表示向量在对应视觉模态中的权重的神经网络模型。
  • 一种基于动态融合机制多模态词汇表示方法
  • [实用新型]呈现机器可读视觉表示的标签-CN201620274642.5有效
  • I·弗里德曼;G·沙里尔;E·斯莫里安斯基 - 艾克尼特有限公司
  • 2016-04-05 - 2016-10-26 - G06K19/06
  • 呈现机器可读视觉表示的标签。呈现机器可读视觉表示的打印介质、其生成处理和扫描处理。该打印介质包括:第一层,该第一层呈现第一视觉元素,第一视觉元素与第一信息关联;和第二层,该第二层包括包含第二视觉元素的基板,该基板当在从不同的视角或在不同的照明条件下观察时能够呈现第二视觉元素的不同视觉外观,该第二视觉元素的至少一部分在视觉表示第二信息,该第一层和该第二层在第一视觉元素与第二视觉元素之间的相对位置处贴附在一起,其中,第一视觉元素和第二视觉元素构成机器可读视觉表示,该视觉表示能够在扫描处理中被扫描以基于第一信息与第二信息之间的关联来验证打印介质的真实性
  • 呈现机器可读视觉表示标签

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

400-8765-105周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top