[发明专利]一种图像生成方法及系统在审
申请号: | 202310342621.7 | 申请日: | 2023-03-31 |
公开(公告)号: | CN116363250A | 公开(公告)日: | 2023-06-30 |
发明(设计)人: | 周叶江;庄光庭;吕雯 | 申请(专利权)人: | 阿维塔科技(重庆)有限公司 |
主分类号: | G06T11/00 | 分类号: | G06T11/00;G10L15/22;G10L15/16;G10L15/06 |
代理公司: | 北京弘权知识产权代理有限公司 11363 | 代理人: | 逯长明;占园 |
地址: | 401121 重庆市渝北*** | 国省代码: | 重庆;50 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 图像 生成 方法 系统 | ||
1.一种图像生成方法,其特征在于,包括:
获取用户输入的第一语音指令;
根据所述第一语音指令,生成所述第一语音指令对应的第一文本摘要;
根据图像生成模型对所述第一文本摘要进行处理,生成所述第一语音指令对应的第一目标图像;
获取用户输入的第二语音指令,所述第二语音指令用于修改所述第一目标图像;
根据所述第二语音指令,生成所述第二语音指令对应的第二文本摘要;
根据所述图像生成模型对所述第二文本摘要和所述第一目标图像进行处理,生成第二目标图像。
2.根据权利要求1所述的图像生成方法,其特征在于,所述根据图像生成模型对所述第一文本摘要进行处理,生成所述第一语音指令对应的第一目标图像,包括:
通过在噪声特征分布中采样获取初始图像特征;所述噪声特征分布为通过所述图像生成模型中的第一图像模型获取的噪声图像在隐空间的特征分布;
根据所述图像生成模型中的第二图像模型对所述第一文本摘要进行处理,生成所述语音指令对应的第一文本特征;
根据所述图像生成模型中的第三图像模型对所述初始图像特征和所述第一文本特征进行处理,生成第一目标图像特征;
对所述第一目标图像特征进行解码,以获取所述第一目标图像。
3.根据权利要求2所述的图像生成方法,其特征在于,根据所述图像生成模型对所述第二文本摘要和所述第一目标图像进行处理,生成第二目标图像,包括:
根据所述图像生成模型中的第二图像模型分别对所述第一目标图像和所述第二文本摘要进行处理,生成所述第一目标图像对应的第一图像特征和所述第二语音指令对应的第二文本特征;
根据所述图像生成模型中的第三图像模型对所述第一图像特征和所述第二文本特征进行处理,生成第二目标图像特征;
对所述第二目标图像特征进行解码,以获取所述第二目标图像。
4.根据权利要求1所述的图像生成方法,其特征在于,在所述根据图像生成模型对所述第一文本摘要进行处理,生成所述第一语音指令对应的第一目标图像前,所述方法还包括:
获取多组样本摘要和多组所述样本摘要一一对应的样本图像;
基于初始图像生成模型中的第一图像模型对所述样本图像进行处理,以生成样本噪声图像特征;
将所述样本摘要输入所述初始图像生成模型中的第二图像模型,得到样本文本特征;
基于所述初始图像生成模型中的第三图像模型对所述样本噪声图像特征和所述样本文本特征进行处理,得到预测目标图像特征;
以所述预测目标图像特征作为所述初始图像生成模型的初始训练输出,样本图像特征作为监督信息,迭代训练所述初始图像生成模型,以得到训练后的图像生成模型。
5.根据权利要求1所述的图像生成方法,其特征在于,所述根据所述第一语音指令,生成所述第一语音指令对应的第一文本摘要,包括:
对所述第一语音指令进行识别,得到第一文本数据;
根据目标提取模型,提取所述第一文本数据的文本摘要,得到所述第一文本摘要。
6.根据权利要求5所述的图像生成方法,其特征在于,在所述根据目标提取模型,提取所述第一文本数据的文本摘要,得到第一文本摘要之前,所述方法还包括:
获取多组历史文本数据和每组所述历史文本数据对应的历史文本摘要;
对所述多组历史文本数据进行预处理,得到多组输入样本数据;所述预处理包括乱序处理和抽取处理中的至少一项;
根据所述输入样本数据和初始提取模型,得到预测文本摘要;
以所述预测文本摘要作为所述初始提取模型的初始训练输出,所述输入样本数据对应的所述历史文本摘要作为监督信息,迭代训练所述初始提取模型得到所述目标提取模型。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于阿维塔科技(重庆)有限公司,未经阿维塔科技(重庆)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202310342621.7/1.html,转载请声明来源钻瓜专利网。
- 彩色图像和单色图像的图像处理
- 图像编码/图像解码方法以及图像编码/图像解码装置
- 图像处理装置、图像形成装置、图像读取装置、图像处理方法
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序以及图像解码程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序、以及图像解码程序
- 图像形成设备、图像形成系统和图像形成方法
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序