[发明专利]可指定类别的优化抠图方法及系统有效
申请号: | 201910881566.2 | 申请日: | 2019-09-18 |
公开(公告)号: | CN110610509B | 公开(公告)日: | 2023-07-21 |
发明(设计)人: | 黄剑波;王榕榕;徐树公 | 申请(专利权)人: | 上海大学 |
主分类号: | G06T7/194 | 分类号: | G06T7/194;G06T7/13;G06T7/187 |
代理公司: | 上海交达专利事务所 31201 | 代理人: | 王毓理;王锡麟 |
地址: | 200444*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 指定 类别 优化 方法 系统 | ||
一种可指定类别的优化抠图方法及系统,采用多类别预测的语义分割网络生成待测图像的不同类别前景的三元图,通过连通域计算可快速获得图片中某一类别的三元图,再采用抠图网络根据选定类别的三元图和待测图像进行精细化抠图,得到优化质量的alpha图。本发明能够自动提取图像中指定类别的前景部分,生成符合各种场景要求的透明底图,可以帮助提升后期图像处理效率,也可帮助市场营销人员用于生成海报等市场营销资料,有效提升商品转化率,减少人工成本。
技术领域
本发明涉及的是一种人工智能图像处理领域的技术,具体是一种可指定类别的优化抠图方法及系统。
背景技术
抠图技术在电商等场景有较大的应用前景和用户需求。传统的抠图技术往往基于三元图(包含有确定的前景部分,确定的背景部分和前背景结合的不确定部分)根据图片的颜色、纹理等低级特征从已知确定像素部分推测不确定像素部分,而没有利用高级的语义信息,这样的方法对于前背景颜色相似或者纹理复杂的图像来说提取效果并不好,对于逐像素的处理也需花费较长时间,可见传统抠图方法难以满足日常应用场景对提取前景的高质量要求和快速处理大量图像的要求。另外,三元图的精确程度也在一定程度上决定了最后提取的前景的质量,三元图越准确,对前景的提取速度越快,质量越高,而传统的三元图的获取方式也需要大量人工。
现有的全自动的人物抠图技术常见基于边缘检测大致检测出前景轮廓,再通过各类算法检测重点区域实现定位,最后根据定位所得到信息进行分割和前背景处理,但这些技术的①前背景颜色十分相近的图像无法达到较好效果,②对于边缘复杂前景部分直接使用语义分割二分类来得到最后的抠图结果,这样的方法精确度较低,③部分方法迭代计算过程复杂,处理所需时间较长,④部分方法只是针对图片中的某个类别而设计的,具有一定的局限性。
发明内容
本发明针对现有自动生成的三元图质量低,抠图效果差,所需时间长的问题,提出一种可指定类别的优化抠图方法及系统,能够自动提取图像中指定的类别的前景部分,生成符合各种场景要求的透明底图(alpha图),可以帮助提升后期图像处理效率,也可帮助市场营销人员用于生成海报等市场营销资料,有效提升商品转化率,减少人工成本。
本发明是通过以下技术方案实现的:
本发明涉及一种可指定类别的优化抠图方法,采用多类别预测的语义分割网络生成待测图像的不同类别前景的三元图,通过连通域计算快速获得所需对象的三元图,再采用抠图网络根据选定类别的三元图和待测图像进行精细化抠图,得到优化质量的alpha图。
所述的多类别预测的语义分割网络,采用ResNet-101架构进行图像特征的提取,输出的是不同类别的语义分割图以及边缘预测。
所述的多类别预测的语义分割网络,通过对图像进行不同类别的语义分割和边缘的三元图的人工标注,用标注后的数据集进行训练。
所述的语义分割是指:根据图片内容的语义信息将图片中不同物体的像素进行分类,采用但不限于深度学习网络对图片进行不同类别前景、背景以及边缘的像素级多分类。
所述的标注,采用但不限于Lableme标注工具对数据集中的图像进行不同前景的类别、确定区域以及不确定区域进行标注。
所述的数据集是指:包含各类前景(如人、包、鞋子等)的网络图片。
所述的待测图像的不同类别前景的三元图,根据语义分割网络预测的类别确定每个类别的三元图中的对应的前景部分,再通过连通域的计算得到与对应前景部分相连的边缘部分作为三元图的未知区域,根据用户指定的某个类别得到其对应的三元图。
本发明涉及一种实现上述方法的系统,包括:语义分割模块、连通域计算模块以及抠图模块,其中:语义分割模块与图片输入相连并传输语义分割后的三元图,连通域模块与语义分割预测所得的三元图、用户指定的类别输入相连并传输相应类别的三元图,抠图模块与图片输入、连通域计算模块所得的三元图相连并得到最终的物体前景alpha图。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海大学,未经上海大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910881566.2/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种静态视频分析方法及系统
- 下一篇:目标跟踪方法、装置、电子设备及存储介质