[发明专利]图像掩模的识别、抠取、模型训练方法、装置及电子设备在审
申请号: | 202011265865.2 | 申请日: | 2020-11-12 |
公开(公告)号: | CN113420769A | 公开(公告)日: | 2021-09-21 |
发明(设计)人: | 陈汐;赵志艳 | 申请(专利权)人: | 阿里巴巴集团控股有限公司 |
主分类号: | G06K9/46 | 分类号: | G06K9/46;G06K9/62;G06N3/04;G06N3/08 |
代理公司: | 北京市惠诚律师事务所 11353 | 代理人: | 刘子敬 |
地址: | 开曼群岛英属开曼群岛*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 图像 识别 模型 训练 方法 装置 电子设备 | ||
1.一种图像掩模的识别方法,包括:
对待识别图像以及用户在所述待识别图像中选定的目标图像基准区域进行特征提取;
以所述目标图像基准区域作为特征扩散源、所述目标图像基准区域以外的一个或多个区域作为特征扩散目的地,确定所述特征扩散源对应的第一特征数据和所述特征扩散目的地对应的第二特征数据之间的特征相似度;
按照所述特征相似度标识的权重,将所述第一特征数据和所述第二特征数据进行叠加;
根据加权叠加处理后的所述待识别图像对应的特征数据,进行图像掩模识别,生成图像掩模的识别结果。
2.根据权利要求1所述的方法,其中,根据加权叠加处理后的待识别图像的特征数据,进行图像掩模识别,生成图像掩模的识别结果包括:
根据所述加权叠加处理后的待识别图像的特征数据,进行前景点和/或背景点的预测,生成中间预测结果;
将所述目标图像基准区域中的像素点作为像素扩散源,将所述像素扩散源周围的像素点作为像素扩散目的地,以所述像素扩散源和所述像素扩散目的地之间的像素相似度标识的权重,进行中间预测结果加权叠加处理;
根据加权叠加处理后的中间预测结果,生成图像掩模的识别结果。
3.根据权利要求2所述的方法,其中,所述中间预测结果加权叠加处理包括:
基于像素点的像素数据,确定所述像素扩散源和所述像素扩散目的地之间的像素相似度;
以所述像素相似度标识的权重,将作为像素扩散源的中间预测结果加权叠加到所述像素扩散目的地的中间预测结果上;
将当前的像素扩散目的地作为新的像素扩散源,将所述新的像素扩散源周围的像素点作为新的像素扩散目的地,重复执行像素相似度计算以及对中间预测结果的加权叠加处理,直至到达预设轮次。
4.根据权利要求1所述的方法,其中,对用户在待识别图像中选定的目标图像基准区域进行特征提取包括:
获取用户选定的前景点和/或背景点;
将包含所述前景点和/或背景点的预定范围像素区域作为所述目标图像基准区域;
对所述目标图像基准区域进行特征提取。
5.根据根据权利要求4所述的方法,其中,对所述目标图像基准区域进行特征提取包括:
使用高斯核函数进行处理,生成该目标图像基准区域的高斯图,针对该高斯图进行特征提取。
6.根据权利要求4所述的方法,其中,确定所述像素扩散源和所述像素扩散目的地之间的像素相似度包括:
确定所述像素扩散源和所述像素扩散目的地之间的RGB通道的数据差值作为所述像素相似度。
7.根据权利要求2所述的方法,其中,根据加权叠加处理后的中间预测结果,生成图像掩模的识别结果包括:
将加权叠加处理后的中间预测结果中针对像素点为前景点和/或背景点的预测概率,与预设的置信度阈值进行比较,确定所述待识别图像中的像素点的识别结果。
8.根据权利要求1所述的方法,其中,所述选定的目标图像基准区域包括前景点图像基准区域和/或背景点图像基准区域,所述方法还包括:
根据所述前景点图像基准区域/或背景点图像基准区域的特征数据和待识别图像的特征数据,进行前景点和/或背景点的预测,生成初步预测结果;
根据所述初步预测结果,确定与所述前景点图像基准区域和/或背景点图像基准区域对应的特征扩散目的地。
9.根据权利要求1所述的方法,其中,还包括:
响应于用户再次在待识别图像中选定的目标图像基准区域的操作,以再次选定的目标图像基准区域作为特征扩散源、该目标图像基准区域以外的一个或多个区域作为特征扩散目的地,确定所述特征扩散源对应的第一特征数据和所述特征扩散目的地对应的第二特征数据之间的特征相似度,并执行后续处理。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于阿里巴巴集团控股有限公司,未经阿里巴巴集团控股有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011265865.2/1.html,转载请声明来源钻瓜专利网。
- 彩色图像和单色图像的图像处理
- 图像编码/图像解码方法以及图像编码/图像解码装置
- 图像处理装置、图像形成装置、图像读取装置、图像处理方法
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序以及图像解码程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序、以及图像解码程序
- 图像形成设备、图像形成系统和图像形成方法
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序