[发明专利]基于上下文正则化循环深度学习的图像分割方法有效
| 申请号: | 201811089851.2 | 申请日: | 2018-09-18 |
| 公开(公告)号: | CN109359655B | 公开(公告)日: | 2021-07-16 |
| 发明(设计)人: | 渠慎明;苏靖;刘颜红;张东生;刘珊;渠梦瑶;王青博;张济仕 | 申请(专利权)人: | 河南大学 |
| 主分类号: | G06K9/34 | 分类号: | G06K9/34;G06N3/04 |
| 代理公司: | 郑州联科专利事务所(普通合伙) 41104 | 代理人: | 刘建芳 |
| 地址: | 475001*** | 国省代码: | 河南;41 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 基于 上下文 正则 循环 深度 学习 图像 分割 方法 | ||
本发明提供了基于上下文正则化循环深度学习的图像分割方法,通过卷积操作、上下文正则化操作和循环迭代操作解决了现有同类算法图像区域和非图像区域分割不准确的问题,尤其解决了预测图片大面积错误和边缘分割不清晰的问题,提高了图像分割准确程度。
技术领域
本发明涉及图像语义分割领域,尤其涉及一种基于上下文正则化循环深度学习的图像分割方法。
背景技术
当今社会,手机、平板电脑等智能移动设备已被广泛使用。显示器作为智能移动设备中人机交互不可或缺的界面,主要分为非自发光显示器和自发光显示器。有机发光二极管(Organic Light-Emitting,OLED)作为一种新兴的自发光显示器技术,不同于传统的非自发光显示器,每一个像素都可以提供光源,可以单独调节,易于有效控制电池消耗。现有的功率约束图像增强算法有个明显的不足之处。现有的方法都是直接将整张图片进行调整,这种操作会损失图像的细节信息,影响视觉感受。
基于视觉心理学,显示器内容中有图像的区域(图像区域)像素亮度值的降低对人类视觉感受的影响比较大,而文本和其他空白等无图像区域(非图像区域)像素亮度值的降低对视觉感受的影响相对较小。根据这一特点,本发明将智能移动设备显示器内容,分成图像区域和非图像区域。目前效果较好的图像语义分割方法是全卷积网络(FullyConvolutionalNetworks,FCN),但是FCN在进行图像区域和非图像区域的语义分割操作时,出现了预测图片大面积错误和边缘分割不清晰的问题。
发明内容
本发明的目的在于提供基于上下文正则化循环深度学习的图像分割方法,能够解决CN在进行图像区域和非图像区域的语义分割操作时,出现了预测图片大面积错误和边缘分割不清晰的问题。
为了实现上述目的,本发明采用以下技术方案:
基于上下文正则化循环深度学习的图像分割方法,包括以下步骤:
步骤1:对输入图片在VGG19-FCN网络中进行卷积操作,其中,VGG19-FCN网络由18个卷积层、5个池化层和3个反卷积层构成;具体包括以下步骤:
步骤1.1:卷积层操作,采用以下方法:
假设是第1层卷积层的第i层特征映射,定义特征映射为输入量,为输出量,即二值掩膜图,卷积操作如公式(1-1)所示:
其中,是第1层卷积层的第i层卷积层的卷积核,是第l层卷积层的第i层卷积层的偏差参数;n是在中特征映射的数量,*表示为卷积操作,f(·)为激活函数;
步骤1.2:池化层最大池化操作,采用以下公式(1-3)表示:
其中,Ω(m,n)表示特征向量的空间向量的位置(m,n),Δ代表在本算法框架的第7层中;
步骤1.3:反卷积层操作,采用以下方法:
将第一层卷积层的第5层的输出量反卷积到原图大小,再将第一层卷积层的第4层的输出和第3层的输出量也依次反卷积,得到反卷积操作用公式(1-4)表示:
其中是第l层卷积层的第i层卷积层的卷积核,表示为反卷积操作;
步骤1.4:调整学习率,采用以下方法:
学习率的调整如公式(1-5)所示:
其中,Rt为学习率,t为变化计数,t=0,1,2,3;α为衰减指数;ρ=0.90;
步骤2:对卷积层输出的二值掩膜图上下文正则化操作,具体包括以下步骤:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于河南大学,未经河南大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811089851.2/2.html,转载请声明来源钻瓜专利网。





