[发明专利]一种基于深度学习模型的摄像系统自动对焦方法在审
申请号: | 202210568408.3 | 申请日: | 2022-05-24 |
公开(公告)号: | CN115086516A | 公开(公告)日: | 2022-09-20 |
发明(设计)人: | 刘明;李世添;易伟超;董立泉;褚旭红;赵跃进;孔令琴;惠梅 | 申请(专利权)人: | 北京理工大学 |
主分类号: | H04N5/225 | 分类号: | H04N5/225;H04N5/232;G06N3/04;G06N3/08;G06T7/11 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 100081 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 深度 学习 模型 摄像 系统 自动 对焦 方法 | ||
本发明提出了一种基于深度学习模型的摄像系统自动对焦方法。通过构建离焦量回归模型,华为开发板对摄像机捕捉的离焦图像进行离焦量估计,串口信号转换器将估计得到的离焦量大小进行编码处理,传输到舵机驱动模块,进而控制齿轮带动可调焦镜头,完成摄像系统自动对焦的目的。本发明解决了当前传统自动对焦算法存在的响应时间长、离焦估计精度低等问题,为人员在线跟踪、动作捕捉等需要连续变焦的摄像系统提供清晰的对焦图像输入,提升系统的整体性能。
技术领域
本发明涉及计算机视觉,深度学习,自动对焦领域,具体涉及基于深度学习模型的摄像系统自动对焦方法,通过构建回归模型的方式对离焦图像进行离焦量估计,实现摄像系统自动对焦的目的。
背景技术
摄像系统在成像过程中,由于系统对焦不准的影响,获取的图像往往存在图像模糊、细节丢失等退化问题。为提升获取图像的视觉质量,实现摄像系统的自动对焦对摄像系统成像显得尤为重要。
现有的自动对焦方法主要分为两种:对焦深度法(DFF)和离焦深度法(DFD)。DFF通过评价函数对不同对焦位置的图像进行清晰度评价,搜索出的最清晰图像则表示为正确的对焦位置。DFD通过计算离焦图像获取得到深度信息,从而完成自动对焦。尽管取得了一定的效果,但上述方法均存在响应时间长、离焦估计精度低等问题,影响其实际使用。
因此,如何实现摄像系统快速准确的自动对焦成为了该领域人员研究的热点与重点。
发明内容
针对以上问题,本发明提出了一种基于深度学习模型的摄像系统自动对焦方法。得益于卷积神经网络强大的特征拟合能力,模型能够有效的从离焦图像中提取离焦量信息,解决了当前自动对焦算法普遍存在的响应时间长、离焦估计精度低等问题,实现了系统快速准确对焦的目的,为人员跟踪、动作捕捉等需要连续变焦的摄像系统提供清晰的对焦图像,提升系统的整体性能。
本发明所采用的技术方案是,一种基于深度学习模型的摄像系统自动对焦方法具体按照以下步骤实施:
步骤1:随机初始化摄像系统的焦距,采集得到相应图像,对图像的离焦区域进行分割处理,区分获取图像的离焦区域与非离焦区域;
步骤2:利用Zemax软件模拟光学系统,仿真带有离焦量标签的离焦图像作为模型的训练集,基于深度学习模型构造包含多层卷积的非线性回归模型,利用MSE损失函数,通过仿真数据集对模型进行迭代训练,获得离焦量估计模型;
步骤3:在华为Atlas开发板中将训练好的离焦量回归模型进行移植,对步骤1中分割出的离焦区域实现离焦量估计,回归计算得到对应的离焦量大小;
步骤4:将离焦量大小通过多功能串口信号转换器转换为控制电机转动的电平信号,通过控制舵机驱动可调焦镜头移动,实现自动对焦的目的。
本发明的特点还在于:
步骤1具体实施过程如下:首先,由于对焦位置不准确,摄像系统在随机初始化的离焦状态下获得的图像存在局部模糊、细节丢失等问题,其次,利用增强型二维OTSU分割算法对所获得的离焦图像进行分割处理,分别得到图像的对焦区域与离焦区域,最后,将离焦区域图像作为回归模型的输入,进而估计系统离焦量大小。
步骤2具体实施过程如下:首先,利用Zemax软件模拟仿真光学系统,随机生成一系列的点扩散函数PSF与其对应的离焦量值,其次,将清晰的自然图像与仿真生成的PSF进行卷积操作,生成相应的离焦图像,将离焦图像与离焦量真值一一对应构建训练数据集,最后,搭建多层神经网络的离焦量回归模型,利用MSE损失函数作为模型的整体优化目标,生成的仿真数据集作为训练数据集,对模型进行参数更新训练,实现预测离焦量大小的目的。
步骤3中的具体实施过程如下:首先,为了便于自动对焦算法的落地实用,在华为Atlas开发板中进行了模型的移植与部署,其次,将步骤1中的分割离焦区域图像作为回归模型的输入,在Atlas开发板中进行离焦量的估计,最后,回归得到相应的离焦量大小数值。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京理工大学,未经北京理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210568408.3/2.html,转载请声明来源钻瓜专利网。