专利名称
主分类
A 农业
B 作业;运输
C 化学;冶金
D 纺织;造纸
E 固定建筑物
F 机械工程、照明、加热
G 物理
H 电学
专利下载VIP
公布日期
2023-10-24 公布专利
2023-10-20 公布专利
2023-10-17 公布专利
2023-10-13 公布专利
2023-10-10 公布专利
2023-10-03 公布专利
2023-09-29 公布专利
2023-09-26 公布专利
2023-09-22 公布专利
2023-09-19 公布专利
更多 »
专利权人
国家电网公司
华为技术有限公司
浙江大学
中兴通讯股份有限公司
三星电子株式会社
中国石油化工股份有限公司
清华大学
鸿海精密工业股份有限公司
松下电器产业株式会社
上海交通大学
更多 »
钻瓜专利网为您找到相关结果62个,建议您升级VIP下载更多相关专利
  • [发明专利]一种多目标导航方法、系统、装置及存储介质-CN202310684966.0在审
  • 谭明奎;陈沛豪;吉冬昱;林坤阳;杜卿 - 华南理工大学
  • 2023-06-09 - 2023-10-24 - G01C21/20
  • 本发明公开了一种多目标导航方法、系统、装置及存储介质,涉及移动智能体对室内环境的探索与感知。其中方法包括:在预设的多目标导航策略上加入摄像头转动策略;以智能体为中心获取障碍物地图;设计启发式规则,为摄像头转动策略提供先验知识;结合启发式规则提供的转动参考方向、地图以及导航动作,利用深度神经网络预测摄像头转动参考方向;使用以探索为导向的奖励函数,对摄像头转动策略进行优化。本发明将摄像头转动策略建模为深度强化学习过程,通过训练实现摄像头转动和身体移动的协调工作,解决了被动摄像头转动策略探索效率低的问题,可以有效地提高多目标物体导航性能。
  • 一种多目标导航方法系统装置存储介质
  • [发明专利]基于大语言模型控制的视频自动分析方法、装置及介质-CN202311063368.8在审
  • 谭明奎;游增;周凯 - 华南理工大学
  • 2023-08-22 - 2023-10-24 - G06V20/40
  • 本发明公开了一种基于大语言模型控制的视频自动分析方法、装置及介质,属于计算机视觉领域。其中方法包括:构造任务提示语句,将任务提示语句输入预训练的大语言模型,使大语言模型明确后续的任务要求、指令内容以及输入输出;获取视频数据,对视频数据进行预处理,获得视频处理单元,根据视频处理单元提取视频中的场景信息和视频内容;将提取到的场景信息和视频内容按照预设的格式组织,并输入训练后的大语言模型,进行模型选择;根据大语言模型的模型选择结果调用相应的感知模型对视频数据进行处理和分析。本发明根据视频场景和内容的动态变化,自动选择合适的感知模型对视频进行处理和分析,更加适用于大规模、多场景、高动态变化的视频分析。
  • 基于语言模型控制视频自动分析方法装置介质
  • [发明专利]一种微动作时间学参数获取方法、装置及介质-CN202310664035.4在审
  • 谭明奎;阮湘辉;陈卓琨;游增 - 华南理工大学
  • 2023-06-06 - 2023-10-10 - G06V20/40
  • 本发明公开了一种微动作时间学参数获取方法、装置及介质,属于医疗视频理解与识别领域。其中方法包括:获取吞咽造影视频数据;根据吞咽造影视频数据提取视频特征;所述视频特征包括RGB特征以及光流特征;将提取到的视频特征输入可变窗口大小的注意力机制,进行特征增强处理,输出视觉增强特征;将视觉增强特征输入由粗到细两阶段微动作定位网络,输出吞咽造影微动作定位和识别的结果。本发明通过利用视频理解中的时序动作定位技术,实现对吞咽造影视频进行时序上的自动定位,获取吞咽过程中各微动作的时序信息,为实现吞咽造影智能定量分析,提供可靠的依据。
  • 一种微动时间参数获取方法装置介质
  • [发明专利]基于语言描述的户型设计方法和装置以及系统-CN202011279236.5有效
  • 王宇涵;唐睿;陈奇;吴琦;谭明奎;王帅 - 杭州群核信息技术有限公司
  • 2020-11-16 - 2023-10-03 - G06F30/12
  • 本发明公开了一种基于语言描述的户型设计方法和装置以及系统,包括:获取用户的语音数据并转换成文本数据;提取文本数据中关于户型设计的属性信息,并以属性信息为节点,按照文本语义对节点进行连接,形成属性语义图;采用基于神经网络构建的布局预测模型对属性语义图进行布局预测,输出预测的户型布局图,并对户型布局图进行优化处理,获得优化的户型布局图;采用基于生成式对抗网络构建的纹理生成模型根据文本语义生成纹理信息;依据优化的户型布局图和纹理信息生成三维场景模型并渲染得到多视角的场景渲染图。该户型设计方法和装置以及系统根据用户的语音数据进行自动化户型设计,在设计户型满足用户需求的基础上,提升了户型设计效率。
  • 基于语言描述户型设计方法装置以及系统
  • [发明专利]一种三维人脸表情动画生成方法、系统、装置及介质-CN202310833336.5在审
  • 谭明奎;刘旭;杜卿 - 华南理工大学
  • 2023-07-07 - 2023-09-19 - G06T13/40
  • 本发明公开了一种三维人脸表情动画生成方法、系统、装置及介质,属于人脸动画生成技术。其中方法包括:获取输入音频,提取细粒度音频情绪特征,并得到音频情绪软标签;将音频情绪特征映射为三维人脸模型的系数序列;提取系数序列中的情绪特征,并得到系数序列的情绪软标签;根据系数序列计算得到三维人脸顶点坐标;根据计算得到的三维人脸顶点坐标与真实人脸顶点坐标计算顶点损失,根据音频情绪软标签和系数序列的情绪软标签计算情绪一致性损失,根据这两项损失计算模型参数的梯度,并对模型参数进行更新。本发明构建了一种情绪一致性约束,能够为模型训练提供与情绪直接相关的监督信号,确保模型优化过程中准确关注人脸表情动画效果。
  • 一种三维表情动画生成方法系统装置介质
  • [发明专利]一种基于开放场景地图的视觉语言导航方法、装置及介质-CN202310788171.4有效
  • 谭明奎;陈沛豪;吉冬昱;林坤阳;杜卿 - 华南理工大学
  • 2023-06-30 - 2023-09-12 - G01C21/20
  • 本发明公开了一种基于开放场景地图的视觉语言导航方法、装置及介质,属于智能导航技术领域。其中方法包括:获取智能体在环境中的视觉图像数据;根据视觉图像数据构建开放场景地图表征,所述开放场景地图表征包括物体属性层级地图、开放场景物体语义地图和标志物语义层级地图;根据构建的开放场景地图表征预测子目标点的位置及导航进度,并执行对应动作。本发明将物体属性层级信息结合开放场景物体和指令标志物的语义信息,将以上信息结合构建开放场景地图,提升该地图对开放场景中多样化物体的属性、位置的表征能力,使地图表征不局限于固定的少量物体类别,且增加的物体属性信息可帮助智能体消除物体类别歧义,准确定位感兴趣物体。
  • 一种基于开放场景地图视觉语言导航方法装置介质
  • [发明专利]一种多智能体强化学习方法、装置及介质-CN202310824569.9有效
  • 谭明奎;林坤阳;王宇丰;陈沛豪;杜卿;胡灏;李利 - 华南理工大学;广东广物互联网科技有限公司
  • 2023-07-06 - 2023-09-12 - G05B13/04
  • 本发明公开了一种多智能体强化学习方法、装置及介质,属于多个智能体行为自主控制技术领域。其中方法包括:获取观测,智能体根据观测获取动作概率分布,以及推理队友智能体基于观测的动作概率分布;根据获得的动作概率分布,计算每个智能体与队友智能体的行为一致性;通过动态缩放网络获取动态调节因子,根据动态调节因子计算行为一致性的内部奖励;根据链式求导法则,以最大化外部回报为目标,对动态缩放网络的参数进行优化;使用优化完成的策略实现多智能体的协作任务。本发明提出一种基于行为一致性的内在奖励,解决多智能体协作算法忽略智能体之间行为意图的配合,从而导致出现次优化策略的问题,能够有效地提高多智能体之间的协作性能。
  • 一种智能强化学习方法装置介质
  • [发明专利]一种基于锚点的密集嵌入生成方法、装置和存储介质-CN202310606289.0在审
  • 谭明奎;黄尚昕;刘立钊;庄壮伟;杜卿;吴祥淼 - 华南理工大学
  • 2023-05-25 - 2023-09-01 - G06F16/53
  • 本发明公开了一种基于锚点的密集嵌入生成方法、装置和存储介质,可广泛应用于嵌入生成技术。其中方法包括:获取待检索的目标图像;将所述目标图像输入目标模型中;利用所述目标模型将所述目标图像映射到特征空间中,按照特征空间中的距离进行比较,获得检索结果;其中,所述目标模型通过利用锚点嵌入生成的密集嵌入来训练深度神经网络模型后获得。本发明利用锚点附近的特征空间来稠密的生成无对应数据点的嵌入特征进行训练,从而实现更加准确的图像检索,解决深度度量学习中由于计算资源限制,从而导致现有采样无法采样到有效样本的问题。此外,本发明还能够直接集成到现有的深度度量学习框架中,无需任何额外的修改,并且具有显著的技术效果。
  • 一种基于密集嵌入生成方法装置存储介质
  • [发明专利]一种自监督视觉语言导航预训练方法、装置及存储介质-CN202310425915.6有效
  • 谭明奎;林坤阳;陈沛豪;黄狄伟;杜卿 - 华南理工大学
  • 2023-04-20 - 2023-08-22 - G06V20/40
  • 本发明公开了一种自监督视觉语言导航预训练方法、装置及存储介质,其中方法包括:获取房屋游览视频,对房屋游览视频进行过滤,获得有效帧;根据获得的有效帧,通过基于熵最小值理论的轨迹生成算法构建导航轨迹;根据获得的导航轨迹构建导航指令;根据导航轨迹和导航指令构建轨迹‑指令对,生成预训练数据集;根据获得的预训练数据集,使用轨迹判断任务对网络架构进行预训练。本发明首次采用房屋游览视频构建视觉语言导航预训练数据,自动化地生成导航轨迹和导航指令,构建轨迹‑指令对,有效地降低标注成本。另外,设计了针对布局推理能力学习的预训练任务,实现了视觉语言导航智能体对房屋布局知识的学习,可广泛应用于视觉语言导航技术领域。
  • 一种监督视觉语言导航训练方法装置存储介质

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

400-8765-105周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top