[发明专利]模型确定方法、装置、电子设备和存储器在审

申请号：	202111212328.6	申请日：	2021-10-18
公开（公告）号：	CN113947195A	公开（公告）日：	2022-01-18
发明（设计）人：	王龙超;孙逸鹏;姚锟;韩钧宇;刘经拓;丁二锐	申请（专利权）人：	北京百度网讯科技有限公司
主分类号：	G06N3/04	分类号：	G06N3/04;G06N3/08;G06F16/36;G06V10/764;G06V10/774;G06K9/62
代理公司：	北京博浩百睿知识产权代理有限责任公司 11134	代理人：	丰佩印
地址：	100085 北京市***	国省代码：	北京;11
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	模型确定方法装置电子设备存储器
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【说明书】：

本公开提供了一种模型确定方法、装置、电子设备和存储器，涉及计算机技术领域，尤其涉及计算机视觉和深度学习领域，可应用于图像处理、图像识别等场景。具体实现方案为：获取第一图像样本和第一文本样本；对第一图像样本和第一文本样本进行训练，得到第一目标模型，其中，第一目标模型学习到第一文本样本的局部特征；获取第二图像样本和第二文本样本，并基于第二图像样本和第二文本样本对第一目标模型进行训练，得到第二目标模型，第二目标模型学习到第二文本样本的全局特征；将第二目标模型确定为第三目标模型的初始化模型，初始化模型的训练效果低的技术问题。

技术领域

本公开涉及人工智能技术领域，尤其涉及计算机视觉和深度学习领域，可应用于图像处理、图像识别等场景，具体涉及一种模型确定方法、装置、电子设备和存储器。

背景技术

目前，对模型的预训练方案通常是采用一步训练法来进行实现，也即，将图像样本和文本样本直接输入至预训练网络来进行预训练任务，这样使得初始化模型的训练指标不高。

发明内容

本公开提供了一种模型确定方法、装置、电子设备和存储器。

根据本公开的一方面，提供了一种模型确定方法。该方法可以包括：获取第一图像样本和第一文本样本，其中，第一文本样本中的文本用于对第一图像样本中的目标图像进行文字描述；对第一图像样本和第一文本样本进行训练，得到第一目标模型，其中，第一目标模型学习到第一文本样本的局部特征；获取第二图像样本和第二文本样本，并基于第二图像样本和第二文本样本对第一目标模型进行训练，得到第二目标模型，其中，第二文本样本中的文本用于对第二图像样本中目标图像进行文字描述，第二目标模型学习到第二文本样本的全局特征；将第二目标模型确定为第三目标模型的初始化模型。

根据本公开的一方面，提供了另一种模型确定方法。该方法可以包括：向服务器发送模型训练请求，其中，模型训练请求包括第一图像样本和第一文本样本，其中，第一文本样本中的文本用于对第一图像样本中的目标图像进行文字描述；接收服务器响应模型训练请求而发送的初始化模型，其中，初始化模型为服务器基于第二图像样本和第二文本样本对第一目标模型进行训练得到，第一目标模型为服务器对第一图像样本和第一文本样本进行训练得到，第一目标模型学习到第一文本样本的局部特征，第二文本样本中的文本用于对第二图像样本中目标图像进行文字描述，初始化模型学习到第二文本样本的全局特征。

根据本公开的一方面，提供了另一种图像处理方法，包括：获取待处理图像；将待处理图像输入至第三目标模型中，其中，第三目标模型为根据本公开实施例的模型确定方法获得；获取第三目标模型的处理结果。

根据本公开的一方面，提供了一种模型确定装置。该装置可以包括：第一获取单元，用于获取第一图像样本和第一文本样本，其中，第一文本样本中的文本用于对第一图像样本中的目标图像进行文字描述；训练单元，用于对第一图像样本和第一文本样本进行训练，得到第一目标模型，其中，第一目标模型学习到第一文本样本的局部特征；处理单元，用于获取第二图像样本和第二文本样本，并基于第二图像样本和第二文本样本对第一目标模型进行训练，得到第二目标模型，其中，第二文本样本中的文本用于对第二图像样本中目标图像进行文字描述，第二目标模型学习到第二文本样本的全局特征；确定单元，用于将第二目标模型确定为第三目标模型的初始化模型。

根据本公开的一方面，还提供了另一种模型确定装置。该装置可以包括：发送单元，用于向服务器发送模型训练请求，其中，模型训练请求包括第一图像样本和第一文本样本，其中，第一文本样本中的文本用于对第一图像样本中的目标图像进行文字描述；接收单元，用于接收服务器响应模型训练请求而发送的初始化模型，其中，初始化模型为服务器基于第二图像样本和第二文本样本对第一目标模型进行训练得到，第一目标模型为服务器对第一图像样本和第一文本样本进行训练得到，第一目标模型学习到第一文本样本的局部特征，第二文本样本中的文本用于对第二图像样本中目标图像进行文字描述，初始化模型学习到第二文本样本的全局特征。

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于北京百度网讯科技有限公司，未经北京百度网讯科技有限公司许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/pat/books/202111212328.6/2.html，转载请声明来源钻瓜专利网。

同类专利

专利分类

G 物理

G06 计算；推算；计数
G06N 基于特定计算模型的计算机系统
G06N3-00 基于生物学模型的计算机系统
G06N3-02 .采用神经网络模型
G06N3-12 .采用遗传模型
G06N3-04 ..体系结构，例如，互连拓扑
G06N3-06 ..物理实现，即神经网络、神经元或神经元部分的硬件实现
G06N3-08 ..学习方法

免登录下载普通用户下载升级VIP会员，免费下载

[发明专利]模型确定方法、装置、电子设备和存储器在审

专利文献下载