[发明专利]数据处理方法、模型训练方法、装置、设备和存储介质有效
申请号: | 202010224729.2 | 申请日: | 2020-03-26 |
公开(公告)号: | CN113449755B | 公开(公告)日: | 2022-12-02 |
发明(设计)人: | 郭恒;许敏丰;迟颖 | 申请(专利权)人: | 阿里巴巴集团控股有限公司 |
主分类号: | G06V10/77 | 分类号: | G06V10/77;G06V10/82 |
代理公司: | 北京太合九思知识产权代理有限公司 11610 | 代理人: | 孙明子;刘戈 |
地址: | 英属开曼群岛大开*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 数据处理 方法 模型 训练 装置 设备 存储 介质 | ||
1.一种数据处理方法,其特征在于,包括:
接收用户上传的请求数据,其中,所述请求数据包括样本生成请求;
根据所述请求数据,获取输入样本图像,其中,所述输入样本图像包括目标对象;
根据所述用户输入的属性信息在所述输入样本图像中确定出属性信息满足要求的备选图像区域,所述属性信息包括尺寸和/或形状;
响应于用户触发的确认操作,在所述备选图像区域中确定包含所述目标对象的目标图像区域;
根据所述输入样本图像中像素点的像素信息,对所述像素点进行聚类;
根据聚类结果确定包含所述目标对象的目标图像区域对应的空间关系特征;
基于所述空间关系特征,获取生成样本图像。
2.根据权利要求1所述的方法,其特征在于,所述基于所述空间关系特征,获取生成样本图像,包括:
基于所述空间关系特征,通过生成网络,获取所述生成样本图像。
3.一种数据处理方法,其特征在于,包括;
展示用户输入的包含目标对象的输入样本图像;
响应于所述用户的输入操作,根据所述用户输入的图像区域属性信息,在所述输入样本图像中确定具有所述属性信息的备选图像区域,所述属性信息包括尺寸和/或形状;
响应于所述用户触发的确认操作,在所述备选图像区域中确定包含所述目标对象的目标图像区域;
根据所述输入样本图像中像素点的像素信息,对所述像素点进行聚类;
根据聚类结果确定所述目标图像区域对应的空间关系特征;
基于所述空间关系特征,获取生成样本图像。
4.一种数据处理方法,其特征在于,包括:
获取包含目标对象的输入样本图像;
根据属性信息在所述输入样本图像中确定出属性信息满足要求的备选图像区域,所述属性信息包括尺寸和/或形状;
响应于用户触发的确认操作,在所述备选图像区域中确定包含所述目标对象的目标图像区域;
根据所述输入样本图像中像素点的像素信息,对所述像素点进行聚类;
根据聚类结果确定所述输入样本图像中包含所述目标对象的目标图像区域对应的空间关系特征;
将所述空间关系特征输入到训练至收敛的生成网络中,以获得所述生成网络输出的第一生成样本图像。
5.根据权利要求4所述的方法,其特征在于,所述输入样本图像和所述第一生成样本图像为三维图像。
6.根据权利要求5所述的方法,其特征在于,所述方法还包括:
对所述空间关系特征进行变换处理,以扩展所述空间关系特征的数量。
7.根据权利要求4所述的方法,其特征在于,所述方法还包括:
将所述空间关系特征输入到未训练至收敛的生成网络中,以获得所述生成网络输出的第二生成样本图像;
以所述第二生成样本图像作为负样本,以所述输入样本图像作为正样本,对判别网络进行训练;
根据训练后的判别网络对所述生成网络进行训练。
8.根据权利要求7所述的方法,其特征在于,所述根据训练后的判别网络对所述生成网络进行训练,包括:
将所述第二生成样本图像输入到所述训练后的判别网络中,以通过所述训练后的判别网络获得与所述第二生成样本图像对应的第一损失值;
根据所述第一损失值调整所述生成网络的参数。
9.根据权利要求8所述的方法,其特征在于,所述方法还包括:
根据所述第二生成样本图像和所述输入样本图像的相似度,获取所述第二生成样本图像对应的第二损失值;
根据所述第一损失值和所述第二损失值对调整所述生成网络的参数。
10.根据权利要求4所述的方法,其特征在于,所述方法还包括:
以所述输入样本图像以及训练至收敛的生成网络输出的生成样本图像为训练样本,训练分割网络,所述分割网络用于确定输入的待识别图像中是否包含所述目标对象。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于阿里巴巴集团控股有限公司,未经阿里巴巴集团控股有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010224729.2/1.html,转载请声明来源钻瓜专利网。