[发明专利]基于多分类回归模型与自注意力机制的单目图像估计方法在审
| 申请号: | 202110547074.7 | 申请日: | 2021-05-19 |
| 公开(公告)号: | CN113222033A | 公开(公告)日: | 2021-08-06 |
| 发明(设计)人: | 李阳;赵明乐 | 申请(专利权)人: | 北京数研科技发展有限公司 |
| 主分类号: | G06K9/62 | 分类号: | G06K9/62;G06N3/04;G06N3/08 |
| 代理公司: | 北京纽乐康知识产权代理事务所(普通合伙) 11210 | 代理人: | 苏泳生 |
| 地址: | 北京市海淀区西三环北*** | 国省代码: | 北京;11 |
| 权利要求书: | 暂无信息 | 说明书: | 暂无信息 |
| 摘要: | 本发明公开了基于多分类回归模型与自注意力机制的单目图像估计方法,包括首先输入图像通过图像编码器进行替换卷积单元块中卷积,使用空洞卷积来替代;经过图像编码器编码后,根据自注意力模型获取像素级的上下文信息,首先将输入的特征图通过一个单层神经网络和ReLU函数,然后通过对输入的特征图进行全局平均池化,获取图像全局的上下文信息;进入场景深度软推断,将输入图像像素分入深度类,对深度值进行有序回归;通过使用概率图提供的数据获得精确平滑的深度值,得到位置上像素的深度推断值。本发明通过利用有序分类逻辑回归模型与自注意力机制,和深度神经网路进行单目图像场景的深度设计,减少了反复使用同样的空洞卷积核造成的格网效应。 | ||
| 搜索关键词: | 基于 分类 回归 模型 注意力 机制 图像 估计 方法 | ||
【主权项】:
暂无信息
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京数研科技发展有限公司,未经北京数研科技发展有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/202110547074.7/,转载请声明来源钻瓜专利网。





