[发明专利]基于CNN的胶囊网络图像定位改进算法在审
申请号: | 202111484964.4 | 申请日: | 2021-12-07 |
公开(公告)号: | CN114240862A | 公开(公告)日: | 2022-03-25 |
发明(设计)人: | 李新;李孟亭;董璐语 | 申请(专利权)人: | 桂林理工大学 |
主分类号: | G06T7/00 | 分类号: | G06T7/00;G06K9/62;G06N3/04;G06N3/08;G06V10/762;G06V10/82 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 541004 广西壮*** | 国省代码: | 广西;45 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 cnn 胶囊 网络 图像 定位 改进 算法 | ||
1.一种基于CNN的胶囊网络图像定位改进算法,其特征在于:具体包括以下步骤:
步骤一:对输入进行图像增强,降噪,降低对特征的影响;
步骤二:改进xception模型,xception模型添加批量归一化层,下采样层和Dropout层;
步骤三:将处理好的图片传入经过改进的xception模型进行特征提取;
步骤四:将提取好的特征通过胶囊网络进行特征融合;
步骤五:通过定位器将肺炎的位置定位出来,输出定位好的肺炎图像。
2.根据权利要求1所述的一种基于CNN的胶囊网络图像定位算法,其特征在于:步骤一中:按照数据集中的标签,取其中4个值,分别是:x,y,width,height;取出4个值,保证标签数据名跟图像名字一一对应,然后将其打包作为数据集;取其中百分之90作为训练集,百分之10作为测试集;并且对准备输入的图像进行增强,降噪;在输入模型之前,对随机图片进行预处理;预处理采用随机翻转,灰度化,由于本发明进行定位工作,为了防止定位的部分被裁剪开来,所以在预处理部分并不进行随机裁。
3.根据权利要求1所述的一种基于CNN的胶囊网络图像定位算法,其特征在于:步骤二中:在基础的xception模型上,添加下采样层,批归一化层,Dropout层。
4.根据权利要求1所述的一种基于CNN的胶囊网络图像定位算法,其特征在于:步骤三中:设置让图片分批次的传入模型,每个Batch设置为16,每次仅仅传入16张图片到内存当中;在模型运行过程中,将参数设置为repeat,直到整个图片全部传入进去;模型的卷积层设置其中卷积核为3*3,卷积步长设置为2*2,将其填充方式设置为‘same’,这么做的目的是在于保证同一个卷积层中传入下一层的图片大小并没有减小;将卷积层激活函数设置为ReLU,ReLU的公式为:
f(x)≈max(x,x+N(0,1)) (1)
其中,x在经过一层卷积层后,输入到池化中,将池化层的参数设置为2*2的大小,其参数的意义为,按照步长2,取出最大值;对池化层只做窗口大小调整,不再做填充;因此池化层的计算公式为
OUT=max({x*modle}2×2) (2)
在经过一个池化层后,进入加入的Droupout层,本发明将Droupout层参数设置为0.5让其丢失一半的神经元;损失函数设置为多类交叉熵损失函数:
5.根据权利要求1所述的一种基于CNN的胶囊网络图像定位算法,其特征在于:步骤四中:在经过CNN模型后,将在CNN网络中提取的特征输入到胶囊网络中,胶囊网络最大的特征就是将以前各个神经元之间传输的数据由标量变为向量,这样能让数据产生位置的‘意义’;胶囊网络分为许多胶囊层,每个胶囊层有许多的神经元,将该层的每个神经元称之为胶囊;在传入胶囊网络之前需要计算其中的隶属度矩阵
其中Wij为u和v之间的隶属度矩阵,ui为低级胶囊层中的第i个胶囊单元,vj为高级胶囊层中的第j个胶囊单元,m是样本轻缓程度的超参数,m过大会导致据类效果比较差;
在传入网络后,计算并更新聚类中心
在传输过程中,m是一个表示样本轻缓程度的超参数m如果过小会接近硬聚类算法,m的初始值设置为3,每次迭代加1,再比较两次目标函数J的值,如果函数值减少过大,则对m的值进行自加1;
目标函数J:
公式(6)里k为聚类中心的个数,n为数据的个数,Wij为样本ui属于聚类vj中心的隶属度;
由于聚类中心的选择概率
由此可得激活值
最终输出的隶属度矩阵:
Wij=Wij·round(rij) (9)。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于桂林理工大学,未经桂林理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111484964.4/1.html,转载请声明来源钻瓜专利网。