[发明专利]图像处理方法、系统及电子设备在审
申请号: | 202111602632.1 | 申请日: | 2021-12-24 |
公开(公告)号: | CN114356084A | 公开(公告)日: | 2022-04-15 |
发明(设计)人: | 李朝;林超;邹朋成;章嘉伦;胡始昌 | 申请(专利权)人: | 阿里巴巴(中国)有限公司 |
主分类号: | G06F3/01 | 分类号: | G06F3/01;G06F3/04845;G06N20/00;G06Q30/06 |
代理公司: | 北京太合九思知识产权代理有限公司 11610 | 代理人: | 刘戈;柴艳波 |
地址: | 310052 浙江省杭州市滨江*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 图像 处理 方法 系统 电子设备 | ||
1.一种图像处理方法,其特征在于,包括:
响应于用户通过客户端针对一商品触发的请求,确定商品图及模特图;
对所述商品图及所述模特图进行处理,得到模特展示所述商品的展示图;
获取反映所述商品特点的描述信息;
基于所述展示图及所述描述信息,生成所述商品对应的多媒体展示信息。
2.根据权利要求1所述的方法,其特征在于,对所述商品图及所述模特图进行处理,得到模特展示所述商品的展示图,包括:
获取图像处理模型,其中,所述图像处理模型包括形变网络和合成网络;
将所述商品图及所述模特图输入所述形变网络,输出按照所述模特图中模特姿态对所述商品图进行形变后的商品形变图;
将所述商品形变图及所述模特图输入所述合成网络,输出模特展示所述商品的展示图。
3.根据权利要求2所述的方法,其特征在于,还包括:
利用第一训练集,对所述图像处理模型进行第一阶段训练;
确定模特样本图及所述模特样本图中模特展示第一样本商品对应的样本商品图;
利用完成第一阶段训练的所述图像处理模型,生成所述模特样本图中模特展示第二样本商品的样本展示图;
将所述模特样本图、所述第一样本商品对应的样本商品图及所述样本展示图作为第二训练样本集中的训练样本;
利用第二训练集,对所述图像处理模型进行第二阶段训练。
4.根据权利要求1至3中任一项所述的方法,其特征在于,获取反映所述商品特点的描述信息,包括:
从所述商品图中提取图像特征;
获取所述商品图对应商品的商品信息;
基于所述商品信息,确定与所述商品相关的文本特征;
融合所述图像特征及文本特征,得到融合信息;
根据所述融合信息,确定所述描述信息。
5.根据权利要求4所述的方法,其特征在于,基于所述商品信息,确定与所述商品相关的文本特征,包括:
从所述商品信息中提取第一文本特征;
从知识图谱中选取与所述商品相关的词条;
基于选取出的词条,确定第二文本特征。
6.根据权利要求5所述的方法,其特征在于,融合所述图像特征及文本特征,得到融合信息,包括:
利用编码网络模型,分别对所述图像特征、所述第一文本特征及所述第二文本特征进行编码,得到对应的图像特征向量、第一文本特征向量及第二文本特征向量;
基于注意力机制融合所述图像特征向量、所述第一文本特征向量和所述第二文本特征向量,得到所述融合信息。
7.根据权利要求1至3中任一项所述的方法,其特征在于,基于所述展示图及所述描述信息,生成所述商品对应的多媒体展示信息,包括:
根据所述描述信息,生成音频;
获取预设视频;
将所述音频及所述预设视频输入驱动模型,输出所述预设视频中目标对象嘴部按照所述音频做出发音动作、面部按照所述音频做出表情动作的驱动视频;
利用所述驱动视频,驱动所述展示图中模特做出相应动作,得到展示动画;
基于所述展示动画及所述音频,生成所述商品对应的多媒体展示信息。
8.根据权利要求7所述的方法,其特征在于,利用所述驱动视频,驱动所述展示图中模特做出相应动作得到所述展示动画,包括:
对所述驱动视频的图像帧中的运动关键点进行提取;
根据提取出的各图像帧的运动关键点信息及图像帧的顺序,确定相邻图像帧间的运动信息;
基于相邻图像帧间的运动信息,对所述展示图中模特相应区域的像素点进行形变,得到一帧形变图;
按照所述驱动视频中图像帧的顺序,顺序播放多帧形变图,得到所述展示动画。
9.一种图像处理方法,其特征在于,包括:
获取用户输入的模特展示商品的展示图像;
获取所述展示商品的描述信息;
根据所述描述信息及所述展示图像,生成模特展示所述商品的展示视频。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于阿里巴巴(中国)有限公司,未经阿里巴巴(中国)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111602632.1/1.html,转载请声明来源钻瓜专利网。
- 彩色图像和单色图像的图像处理
- 图像编码/图像解码方法以及图像编码/图像解码装置
- 图像处理装置、图像形成装置、图像读取装置、图像处理方法
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序以及图像解码程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序、以及图像解码程序
- 图像形成设备、图像形成系统和图像形成方法
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序