[发明专利]一种基于深度学习的背景去除的方法在审
申请号: | 201910276000.7 | 申请日: | 2019-04-08 |
公开(公告)号: | CN110189330A | 公开(公告)日: | 2019-08-30 |
发明(设计)人: | 颜成钢;谢益峰;孙垚棋;张继勇;张勇东 | 申请(专利权)人: | 杭州电子科技大学 |
主分类号: | G06T7/11 | 分类号: | G06T7/11;G06T7/194 |
代理公司: | 杭州君度专利代理事务所(特殊普通合伙) 33240 | 代理人: | 朱月芬 |
地址: | 310018 浙*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开了一种基于深度学习的背景去除的方法。本发明包括如下步骤:步骤1、对初期数据库的建立,通过采用对COCO数据集的整理以及添加修改得到所需要的对初期数据库;并找到对初期数据库中图片原始信息匹配所对应的标签信息;对初期数据库以及其所对应的标签信息进行预处理操作,包括图像正则化和图像格式转换;步骤2、将步骤1得到的初期数据库作为原始训练数据输入到提拉米苏Tiramisu网络中,得到基本的背景去除的模型;步骤3、将待识别的图片作为输入数据输入到上述模型中进行识别,得到识别结果。本发明实现全自动化操作,只需将所需要进行操作的图片输入到模型中即可自动完成背景去除的目的。 | ||
搜索关键词: | 背景去除 数据库 标签信息 全自动化操作 图像格式转换 原始训练数据 图像正则化 预处理操作 图片输入 原始信息 自动完成 数据集 提拉 匹配 学习 图片 网络 | ||
【主权项】:
1.一种基于深度学习的背景去除的方法,其特征在于包括如下步骤:步骤1、对初期数据库的建立,通过采用对COCO数据集的整理以及添加修改得到所需要的对初期数据库;并找到对初期数据库中图片原始信息匹配所对应的标签信息(API);对初期数据库以及其所对应的标签信息进行预处理操作,包括图像正则化和图像格式转换;步骤2、将步骤1得到的初期数据库作为原始训练数据输入到提拉米苏Tiramisu网络中,得到基本的背景去除的模型,具体的:将初期数据库作为原始数据输入Tiramisu网络中训练网络参数;所述网络中稠密块主要是根据XL=HL([x0,x1,x2..xL‑1]);其中HL的操作包括包括Batch Normalization,ReLU和两个convolution,分别为3*3以及1*1,x0,x1,x2..xL‑1为原始数据,XL为经过HL后的输出信息;所述网络结构实现如下:在经过初始卷积层得到特征图输出x0,采用跳跃连接分为两条路径,其中主路径首先经过Dense Block即稠密块,且每个稠密块中包含HL;另一条路径上并不采用任何操作,保证了输入信息的完整性,同时将x0与主路径中的输出结果相合并,将原输入信息进行优化,去掉其中冗余的部分,并将结果通过Transition Layer用于降维,同时由于跳跃连接的存在,使得梯度能够更加迅速的进行权值的迭代;其中Batch Normalization使提取后的特征均值为0,方差为1,便于之后的计算;3*3以及1*1的convolution操作也称之为bottleneck layer,即利用卷积操作减少输入特征图的数量;ReLU用于提取样本特征;所述提拉米苏网络训练采用自下而上的监督学习方式,包括一初始卷积层、多个Dense Block即稠密块、多个转换层、多个跳跃连接;所述初始卷积层用于对输入的原始数据进行卷积,得到原始的特征图;所述稠密块用于特征重用,提升信息和梯度在网络中的传输效率;所述转换层包含reduction,用来减少或者增加通道数量,缓解梯度消失;所述每个稠密块包含批量归一化(BatchNormalization)、修正线性单元(ReLU)以及卷积(Convolution)操作,用于降维和融合各个通道的特征;每个稠密块之间通过过渡层(Transition Layer)相连接,其中包括卷积(convolution)以及平均池化(mean pooling)的操作;步骤3、将待识别的图片作为输入数据输入到上述模型中进行识别,得到识别结果。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于杭州电子科技大学,未经杭州电子科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201910276000.7/,转载请声明来源钻瓜专利网。