[发明专利]一种基于深层交互式测地距离的图像分割方法在审
申请号: | 201711027674.0 | 申请日: | 2017-10-27 |
公开(公告)号: | CN107590813A | 公开(公告)日: | 2018-01-16 |
发明(设计)人: | 夏春秋 | 申请(专利权)人: | 深圳市唯特视科技有限公司 |
主分类号: | G06T7/11 | 分类号: | G06T7/11;G06T7/194;G06N3/04 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 518057 广东省深圳市高新技术产业园*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 深层 交互式 距离 图像 分割 方法 | ||
技术领域
本发明涉及图像领域,尤其是涉及了一种基于深层交互式测地距离的图像分割方法。
背景技术
随着数字产品和互联网技术的发展,多媒体信息迅速膨胀,越来越多的数字图像被产生、传输和利用。图像作为一种内容丰富、表现直观、表达形式多样化的数字媒体形式越来越受到人们的重视,与图像相关的技术也成为人们研究的重点。其中的图像分割技术是图像识别和计算机视觉至关重要的预处理步骤,它已广泛应用于机器视觉、人脸识别、指纹识别、交通控制系统、卫星图像中定位物体(道路、森林等)、行人检测等。在医学图像分析中,图像分割技术尤为重要,它可以用于医学影像中肿瘤和其他病理的定位、组织体积的测量,还可以对病灶区域进行分割,帮助医生进行准确地诊断和实施进一步的治疗,从而实现精确的医学图像诊断。然而,先前的方法图像质量差,如存在噪音、对比度低、分辨率的问题,难以实现有效分割。
本发明提出了一种基于深层交互式测地距离的图像分割方法,先由用户检查初始分割提议网络自动获得的初始分割结果,并给出涂鸦或点击指示错误分割,用测地距离对特征空间中的变量进行编码,并将其与随机森林算法相结合进行语义分割,接着改造网络结构,在每个块中使用扩展卷积,最后利用可反向传播的条件随机场网络生成具有自由成对电势和用户约束。本发明提供更好的密集预测的分辨率保留网络,用户干预少,所用时间更少,提高了准确性和可靠性;同时,恢复了边缘细节并减少像素分类中的噪点,使图像质量有效提高。
发明内容
针对存在噪音、对比度低、分辨率的问题,本发明的目的在于提供一种基于深层交互式测地距离的图像分割方法,先由用户检查初始分割提议网络自动获得的初始分割结果,并给出涂鸦或点击指示错误分割,用测地距离对特征空间中的变量进行编码,并将其与随机森林算法相结合进行语义分割,接着改造网络结构,在每个块中使用扩展卷积,最后利用可反向传播的条件随机场网络生成具有自由成对电势和用户约束。
为解决上述问题,本发明提供一种基于深层交互式测地距离的图像分割方法,其主要内容包括:
(一)基于用户交互的测地距离图;
(二)使用扩展卷积的卷积神经网络结构保留分辨率;
(三)可反向传播的条件随机场网络。
其中,所述的深层交互式测地距离,为了最小化用户交互,建议使用两个卷积神经网络(CNN):初始分割建议网络和细化网络;初始分割提议网络将带有CI通道的原始图像作为输入,并自动给出初始分割;然后,用户开始检查分割,并给出一些交互(点击或涂鸦)来指示错误分割的区域;细化网络获取原始输入图像的信息进行初始分割和用户交互,以提供精细分割;初始分割提议网络和细化网络使用分辨率保留结构,从大的接收场捕获高级特征,而不损失分辨率;它们除了输入尺寸的差异外具有相同的结构;基于由初始分割提议网络自动获得的初始分割,用户可以通过细化网络多次通过点击/涂鸦来优化结果;
为了使分割结果在空间上更一致,使用涂鸦作为硬性约束,初始分割提议网络和细化网络均与条件随机场(CRF)连接,CRF被建模为循环神经网络(RNN),即CRF网络,因此可以与初始分割提议网络或细化网络通过反向传播,在CRF网络中使用自由成对的电势。
其中,所述的基于用户交互的测地距离图,用户检查由初始分割提议网络自动获得的初始分割结果,并给出涂鸦(或点击)指示错误分割;涂鸦给出了一组像素“前景”或“背景”的标签;与相同标签的交互转换为距离图,其中使用了欧几里德距离;使用测地距离能更好地区分不同外观的相邻像素,并提高均匀区域的标签一致性;使用测地距离对特征空间中的变量进行编码,并将其与随机森林算法相结合进行语义分割;但它不是为了处理用户交互而设计的;建议通过测地距离变换对用户交互进行编码,以进行基于CNN的分割;
假设和分别表示属于前景涂鸦和背景涂鸦的像素集合;从图像I中的每个像素i到涂鸦集的无符号测地距离为:
其中,是像素i和j之间的所有路径的集合;p是一个可行路径,由s∈[0,1]参数化;u(s)是与路径方向相切的单位向量,定义为u(s)=p′(s)/‖p′(s)‖;如果没有为前景或背景绘制涂鸦,则相应的测地距离图用随机数填充。
进一步地,所述的测地距离图,用户交互和原始分割的测地距离图具有与I相同的高度和宽度,并且它们与I的通道相连,从而获得具有CI+3通道的级联图像,并将其用作细化网络。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于深圳市唯特视科技有限公司,未经深圳市唯特视科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201711027674.0/2.html,转载请声明来源钻瓜专利网。