专利名称
主分类
A 农业
B 作业;运输
C 化学;冶金
D 纺织;造纸
E 固定建筑物
F 机械工程、照明、加热
G 物理
H 电学
专利下载VIP
公布日期
2023-10-24 公布专利
2023-10-20 公布专利
2023-10-17 公布专利
2023-10-13 公布专利
2023-10-10 公布专利
2023-10-03 公布专利
2023-09-29 公布专利
2023-09-26 公布专利
2023-09-22 公布专利
2023-09-19 公布专利
更多 »
专利权人
国家电网公司
华为技术有限公司
浙江大学
中兴通讯股份有限公司
三星电子株式会社
中国石油化工股份有限公司
清华大学
鸿海精密工业股份有限公司
松下电器产业株式会社
上海交通大学
更多 »
钻瓜专利网为您找到相关结果11个,建议您升级VIP下载更多相关专利
  • [发明专利]基于图卷积的不完整观测条件下的行人重识别方法及系统-CN202310921268.8在审
  • 刘萌;张风雷;张昊宇;许海振;韩强;严明;聂礼强 - 山东建筑大学
  • 2023-07-25 - 2023-10-10 - G06V40/10
  • 本发明属于行人重识别技术领域,尤其涉及一种基于图卷积的不完整观测条件下的行人重识别方法及系统,包括:获取行人图像并进行预处理;分别对预处理后的行人图像进行局部特征提取、全局特征提取和属性特征提取,得到行人图像的关键点表示、全局视觉特征以及文本属性特征;将全局视觉特征与关键点表示输入至自适应阈值引导的掩码图卷积网络,得到视觉引导的关键点;基于文本属性特征和关键点表示,利用循环异构图卷积网络获得属性增强的关键点和视觉增强的属性;将视觉引导的关键点、属性增强的关键点和视觉增强的属性进行加权融合得到最终的行人表示。本发明的循环异构图卷积网络通过图内和图间的交互有效地融合了结构化的视觉和文本行人信息。
  • 基于图卷完整观测条件下行人识别方法系统
  • [发明专利]一种问题理解导向的视频问答方法及系统-CN202311098884.4在审
  • 刘萌;厉盛华;许海振;韩强;郭杰;马玉玲;宋立莉;刘旭雅 - 山东建筑大学
  • 2023-08-30 - 2023-09-29 - G06V20/40
  • 本发明属于多媒体问答技术领域,提出了一种问题理解导向的视频问答方法及系统,包括:对视频帧进行特征提取得到外观特征、对象特征和动作特征;对问题进行多层编码后获得单词级问题表示和全局问题表示;利用全局问题表示和视频帧的特征表示作为指导,将对象特征整合到外观中,得到每个视频帧的对象增强的外观特征;将单词级问题表示分别与对象增强的外观特征以及动作特征进行拼接后输入到模型中,得到外观增强的单词级问题表示以及动作增强的单词级问题表示;将外观增强的单词级问题表示以及动作增强的单词级问题表示进行加权融合后输入答案解码器推断出答案。本发明通过利用来自视频的多模态信息,获得对问题的全面理解。
  • 一种问题理解导向视频问答方法系统
  • [发明专利]一种多模态第一视角视频分类方法及系统-CN202310016150.0有效
  • 刘萌;张风雷;宋雪萌;许海振;郭杰;王少华 - 山东建筑大学
  • 2023-01-06 - 2023-04-25 - G06V20/40
  • 本发明属于计算机视觉领域,提供了一种多模态第一视角视频分类方法及系统。该方法包括,获取视频数据和视频动作类别,提取视频数据的视觉表示序列和音频表示序列;采用基于联合表示的交叉注意模块,得到联合表示增强的视觉特征表示序列和联合表示增强的音频特征表示序列;计算视觉模态的自监督对比损失函数和音频模态的自监督对比损失函数;计算视觉模态的分类预测结果和音频模态的分类预测结果;计算分类预测损失函数;构建联合损失函数,用于联合优化第一视角视频分类网络,得到已训练的第一视角视频分类网络。本发明针对每个模态应用自监督对比学习来增强模态内特征,使这些特征不受与动作有关的干扰因素的影响,提升了动作分类的精准度。
  • 一种多模态第一视角视频分类方法系统
  • [发明专利]一种面向开放域查询的视频片段搜索方法及系统-CN202310010413.7有效
  • 刘萌;李达;许海振;宋雪萌;郭杰;李晓峰 - 山东建筑大学
  • 2023-01-05 - 2023-03-28 - G06F16/73
  • 本发明属于互联网技术领域,提供了一种面向开放域查询的视频片段搜索方法及系统。该方法包括,获取视频数据和自然语言查询描述数据;基于自然语言查询描述数据,采用预训练的词语编码模型,得到自然语言查询描述表示;基于视频数据,得到候选时序视频片段;计算自然语言查询描述表示与候选时序视频片段的相似度分数,选取相似度分数最高的候选视频片段作为目标视频片段;训练包括:获取维基百科文本语料库数据和知识图谱数据;构建词语编码模型;基于维基百科文本语料库数据和知识图谱数据,训练词语编码模型,得到预训练的词语编码模型。本发明通过融入知识图谱,增强开放域查询描述中关键词语信息的理解,获得更精准的开放域自然语言查询表示。
  • 一种面向开放查询视频片段搜索方法系统

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

400-8765-105周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top