[发明专利]用于翡翠图像分割的方法及模型训练方法有效

申请号：	202011353434.1	申请日：	2020-11-26
公开（公告）号：	CN112465835B	公开（公告）日：	2022-07-08
发明（设计）人：	易金鹏;王秀辉;刘继澎	申请（专利权）人：	深圳市对庄科技有限公司
主分类号：	G06T7/11	分类号：	G06T7/11;G06T7/13;G06T7/136;G06N3/04;G06N3/08;G06N20/00;G06T5/40;G06T5/50
代理公司：	深圳市精英专利事务所 44242	代理人：	谭穗平
地址：	518000 广东省深圳市福田区福***	国省代码：	广东;44
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	用于翡翠图像分割方法模型训练
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【权利要求书】：

1.一种用于翡翠图像分割的方法，其特征在于，包括：

响应于获取到包含翡翠图像的原始图像，将所述原始图像输入至基于机器学习预训练的第一网络模型中，以使所述第一网络模型对所述原始图像进行分割，输出包含无背景图的初始翡翠图像；

将所述初始翡翠图像输入至基于机器学习预训练的第二网络模型中，以使所述第二网络模型对所述初始翡翠图像的高光区域图像进行分割，输出不包含高光区域图像的翡翠图像；

所述响应于获取到原始图像，将所述原始图像输入至基于机器学习预训练的第一网络模型中，以使所述第一网络模型对所述原始图像进行分割，输出包含无背景图的初始翡翠图像包括：响应于获取到视频中每一帧的图像，确定视频中所有帧的图像中满足预设条件的图像；将所述满足预设条件的图像输入至基于机器学习预训练的第一网络模型中，以使所述第一网络模型对所述原始图像进行分割，输出包含无背景图的初始翡翠图像；通过以下两种方式之一确定满足预设条件的图像：基于预设的图像质量评分策略，确定质量最优的图像；基于视频帧中的多个不同角度的图像进行综合处理，确定可输入至第一网络模型中的图像；

在输入至第一网络模型之前首先对原始图像进行预处理：通过零填充缩放成513*513大小格式，在得到初始翡翠图像之后，利用PointRend算法，对初始翡翠图像利用渲染做填充区域，迭代上采样，针对初始翡翠图像的边缘进行优化；

所述第一网络模型的模型训练方法，包括：对原始图像集中每一张包含翡翠的原始图像预处理，得到原始图像中翡翠图像的掩膜；将作为正样本的所述掩膜和作为负样本的所述原始图像集中不包含翡翠的原始图像按照3：1的数量比输入至语义分割网络模型中，以训练所述语义分割网络模型识别图像中的背景区域图像和翡翠图像，并将背景区域图像和翡翠图像分割；

其中，所述对原始图像集中每一张包含翡翠的原始图像预处理，得到原始图像中翡翠图像的掩膜包括：基于预设的策略，对所述原始图像的翡翠图像与背景图像进行分割并去除背景图像，得到翡翠图像；基于二值化处理策略，提取翡翠图像的掩膜；

其中，将作为正样本的所述掩膜和作为负样本的所述原始图像集中不包含翡翠的原始图像按照预设的数量比输入至语义分割网络模型中，以训练所述语义分割网络模型识别图像中的背景区域图像和非背景区域图像包括：配置所述语义分割网络模型的结构；将作为正样本的所述掩膜和作为负样本的所述原始图像集中不包含翡翠的原始图像按照预设的数量比输入至语义分割网络模型中；训练所述语义分割网络模型，以使所述语义分割网络模型识别图像中的背景区域图像和非背景区域图像；

语义分割网络模型的结构采用deeplabV3的网络结构，首先对语义分割网络模型的结构进行配置，包括：将骨干模型替换成mobilenet骨干模型；在不同的卷积层中使用不同的空洞率atrous rate，当输出步长output＿stride＝16时atrous＿rates为[6，12，18]，采用批尺寸batchsize＝32；采用输出步长output＿stride＝8时，atrous＿rates为[12，24，36]，batchsize为16；

第二网络模型的模型训练方法，包括：获取与背景区域图像分割的翡翠图像；基于图像高光估计算法，选取所述翡翠图像的高光区域图像；将作为正样本的所述高光区域图像和作为负样本的非高光翡翠图像按照3：1的数量比输入至第一语义分割模型中，以训练所述第一语义分割模型识别翡翠图像中的高光区域图像和非高光区域图像，并将高光区域图像和非高光区域图像进行分割；

其中，将作为正样本的所述高光区域图像和作为负样本的非高光翡翠图像按照预设的数量比输入至第一语义分割模型中，以训练所述第一语义分割模型识别翡翠图像中的高光区域图像和非高光区域图像，并将高光区域图像和非高光区域图像进行分割包括：配置所述第一语义分割模型的结构；将作为正样本的所述高光区域图像和作为负样本的非高光翡翠图像按照预设的数量比输入至第一语义分割模型中，以训练所述第一语义分割模型识别翡翠图像中的高光区域图像和非高光区域图像，并将高光区域图像和非高光区域图像进行分割；

第一语义分割模型使用多卡模型，将3x3的空洞卷积替换成1x1的空洞卷积，训练模型是采用poly策略，在初始学习率基础上，乘以(1-itermax_iter)＾power，其中power为0.9，itermax_iter为迭代次数与最大迭代次数的比值，dropout系数为0.8；在不同的卷积层中使用不同的空洞率atrous rate，当输出步长output＿stride＝16时，atrous＿rates为[6，12，18]，采用batchsize＝32；采用输出步长output＿stride＝8时，atrous＿rates为[12，24，36]，batchsize为16。

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于深圳市对庄科技有限公司，未经深圳市对庄科技有限公司许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/pat/books/202011353434.1/1.html，转载请声明来源钻瓜专利网。

上一篇：一种基于注意力图的吸烟行为检测方法及装置
下一篇：一种真空渗油耐磨损的润滑轴承的加工工艺

同类专利

专利分类

G 物理

G06 计算；推算；计数
G06T 一般的图像数据处理或产生
G06T7-00 图像分析，例如从位像到非位像
G06T7-20 .运动分析
G06T7-40 .结构分析
G06T7-60 .图形属性的分析，例如一个图像的区域、重心、周边

免登录下载普通用户下载升级VIP会员，免费下载

[发明专利]用于翡翠图像分割的方法及模型训练方法有效

专利文献下载