[发明专利]用于翡翠图像分割的方法及模型训练方法有效
申请号: | 202011353434.1 | 申请日: | 2020-11-26 |
公开(公告)号: | CN112465835B | 公开(公告)日: | 2022-07-08 |
发明(设计)人: | 易金鹏;王秀辉;刘继澎 | 申请(专利权)人: | 深圳市对庄科技有限公司 |
主分类号: | G06T7/11 | 分类号: | G06T7/11;G06T7/13;G06T7/136;G06N3/04;G06N3/08;G06N20/00;G06T5/40;G06T5/50 |
代理公司: | 深圳市精英专利事务所 44242 | 代理人: | 谭穗平 |
地址: | 518000 广东省深圳市福田区福*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 用于 翡翠 图像 分割 方法 模型 训练 | ||
1.一种用于翡翠图像分割的方法,其特征在于,包括:
响应于获取到包含翡翠图像的原始图像,将所述原始图像输入至基于机器学习预训练的第一网络模型中,以使所述第一网络模型对所述原始图像进行分割,输出包含无背景图的初始翡翠图像;
将所述初始翡翠图像输入至基于机器学习预训练的第二网络模型中,以使所述第二网络模型对所述初始翡翠图像的高光区域图像进行分割,输出不包含高光区域图像的翡翠图像;
所述响应于获取到原始图像,将所述原始图像输入至基于机器学习预训练的第一网络模型中,以使所述第一网络模型对所述原始图像进行分割,输出包含无背景图的初始翡翠图像包括:响应于获取到视频中每一帧的图像,确定视频中所有帧的图像中满足预设条件的图像;将所述满足预设条件的图像输入至基于机器学习预训练的第一网络模型中,以使所述第一网络模型对所述原始图像进行分割,输出包含无背景图的初始翡翠图像;通过以下两种方式之一确定满足预设条件的图像:基于预设的图像质量评分策略,确定质量最优的图像;基于视频帧中的多个不同角度的图像进行综合处理,确定可输入至第一网络模型中的图像;
在输入至第一网络模型之前首先对原始图像进行预处理:通过零填充缩放成513*513大小格式,在得到初始翡翠图像之后,利用PointRend算法,对初始翡翠图像利用渲染做填充区域,迭代上采样,针对初始翡翠图像的边缘进行优化;
所述第一网络模型的模型训练方法,包括:对原始图像集中每一张包含翡翠的原始图像预处理,得到原始图像中翡翠图像的掩膜;将作为正样本的所述掩膜和作为负样本的所述原始图像集中不包含翡翠的原始图像按照3:1的数量比输入至语义分割网络模型中,以训练所述语义分割网络模型识别图像中的背景区域图像和翡翠图像,并将背景区域图像和翡翠图像分割;
其中,所述对原始图像集中每一张包含翡翠的原始图像预处理,得到原始图像中翡翠图像的掩膜包括:基于预设的策略,对所述原始图像的翡翠图像与背景图像进行分割并去除背景图像,得到翡翠图像;基于二值化处理策略,提取翡翠图像的掩膜;
其中,将作为正样本的所述掩膜和作为负样本的所述原始图像集中不包含翡翠的原始图像按照预设的数量比输入至语义分割网络模型中,以训练所述语义分割网络模型识别图像中的背景区域图像和非背景区域图像包括:配置所述语义分割网络模型的结构;将作为正样本的所述掩膜和作为负样本的所述原始图像集中不包含翡翠的原始图像按照预设的数量比输入至语义分割网络模型中;训练所述语义分割网络模型,以使所述语义分割网络模型识别图像中的背景区域图像和非背景区域图像;
语义分割网络模型的结构采用deeplabV3的网络结构,首先对语义分割网络模型的结构进行配置,包括:将骨干模型替换成mobilenet骨干模型;在不同的卷积层中使用不同的空洞率atrous rate,当输出步长output_stride=16时atrous_rates为[6,12,18],采用批尺寸batchsize=32;采用输出步长output_stride=8时,atrous_rates为[12,24,36],batchsize为16;
第二网络模型的模型训练方法,包括:获取与背景区域图像分割的翡翠图像;基于图像高光估计算法,选取所述翡翠图像的高光区域图像;将作为正样本的所述高光区域图像和作为负样本的非高光翡翠图像按照3:1的数量比输入至第一语义分割模型中,以训练所述第一语义分割模型识别翡翠图像中的高光区域图像和非高光区域图像,并将高光区域图像和非高光区域图像进行分割;
其中,将作为正样本的所述高光区域图像和作为负样本的非高光翡翠图像按照预设的数量比输入至第一语义分割模型中,以训练所述第一语义分割模型识别翡翠图像中的高光区域图像和非高光区域图像,并将高光区域图像和非高光区域图像进行分割包括:配置所述第一语义分割模型的结构;将作为正样本的所述高光区域图像和作为负样本的非高光翡翠图像按照预设的数量比输入至第一语义分割模型中,以训练所述第一语义分割模型识别翡翠图像中的高光区域图像和非高光区域图像,并将高光区域图像和非高光区域图像进行分割;
第一语义分割模型使用多卡模型,将3x3的空洞卷积替换成1x1的空洞卷积,训练模型是采用poly策略,在初始学习率基础上,乘以(1-itermax_iter)^power,其中power为0.9,itermax_iter为迭代次数与最大迭代次数的比值,dropout系数为0.8;在不同的卷积层中使用不同的空洞率atrous rate,当输出步长output_stride=16时,atrous_rates为[6,12,18],采用batchsize=32;采用输出步长output_stride=8时,atrous_rates为[12,24,36],batchsize为16。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于深圳市对庄科技有限公司,未经深圳市对庄科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011353434.1/1.html,转载请声明来源钻瓜专利网。
- 彩色图像和单色图像的图像处理
- 图像编码/图像解码方法以及图像编码/图像解码装置
- 图像处理装置、图像形成装置、图像读取装置、图像处理方法
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序以及图像解码程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序、以及图像解码程序
- 图像形成设备、图像形成系统和图像形成方法
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序