[发明专利]一种适用于物体堆叠杂乱场景的基于Transformer机制的抓取检测模型在审

专利信息
申请号: 202210783135.4 申请日: 2022-06-27
公开(公告)号: CN115019147A 公开(公告)日: 2022-09-06
发明(设计)人: 于秀丽;董明帅;魏世民;白宇轩;吴澍 申请(专利权)人: 北京邮电大学
主分类号: G06V10/82 分类号: G06V10/82;G06V10/764;G06V10/774;G06V10/80;G06V10/40;G06N3/04;G06N3/08;G06T7/70
代理公司: 暂无信息 代理人: 暂无信息
地址: 100876 *** 国省代码: 北京;11
权利要求书: 查看更多 说明书: 查看更多
摘要: 发明公开了一种适用于物体堆叠杂乱场景的基于Transformer机制的抓取检测模型,该模型提出使用Transformer机制提取输入图像的特征,然后使用全卷积神经网络预测图片中所有可能的抓取位置。通过将Transformer与卷积神经网络结合,该模型同时融合了Transformer机制优秀的全局建模能力和卷积神经网络的归纳偏置能力。从而使得本模型不需要多次下采样操作在模型的初始阶段就能够对输入图像的全局特征进行建模和相关性计算,避免了传统模型由于下采样造成的特征丢失;此外,本模型同时融合了卷积神经网络的归纳偏置能力,降低了模型训练过程中对大尺寸数据集的依赖。因此,本模型能够更好的对杂乱堆叠场景的特征进行建模,并且可以在小规模数据集上训练出令人满意的结果。基于以上优势,本发明提出的模型可以广泛的应用于各种常见的生活场景的抓取检测任务,具有更强的鲁棒性和环境适应性。
搜索关键词: 一种 适用于 物体 堆叠 杂乱 场景 基于 transformer 机制 抓取 检测 模型
【主权项】:
暂无信息
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京邮电大学,未经北京邮电大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/patent/202210783135.4/,转载请声明来源钻瓜专利网。

同类专利
专利分类
×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top