[发明专利]一种特征提取网络的训练方法、装置及电子设备在审
申请号: | 202210030447.8 | 申请日: | 2022-01-12 |
公开(公告)号: | CN114360027A | 公开(公告)日: | 2022-04-15 |
发明(设计)人: | 李弼;彭楠;希滕;张刚 | 申请(专利权)人: | 北京百度网讯科技有限公司 |
主分类号: | G06V40/16 | 分类号: | G06V40/16;G06V10/764;G06V10/82;G06K9/62;G06N3/08 |
代理公司: | 北京柏杉松知识产权代理事务所(普通合伙) 11413 | 代理人: | 孙翠贤;马敬 |
地址: | 100085 北京市*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 特征 提取 网络 训练 方法 装置 电子设备 | ||
本公开提供了一种特征提取网络的训练方法、装置及电子设备,涉及数据处理技术领域,尤其涉及人工智能模型训练领域。具体实现方案为:获取训练集中的样本图像;将样本图像输入分类模型,得到模型输出结果和样本图像的目标图像特征;识别所述目标图像特征和指定特征的相似性,得到识别结果;利用模型输出结果与识别结果,生成样本图像的类别预测结果;基于类别预测结果和样本图像的类别标签,对分类模型的模型参数进行调整,并返回获取训练集中样本图像的步骤,直至模型收敛,得到训练完成的特征提取网络。通过本方案,可以在降低资源占用的同时保证特征提取网络的准确度。
技术领域
本公开涉及数据处理技术领域,尤其涉及人工智能模型训练领域,具体涉及一种特征提取网络的训练方法、装置及电子设备。
背景技术
针对对象识别场景而言,通常利用特征提取网络,提取待识别图像的图像特征,然后,识别所提取图像特征与底库中各个图像特征的相似性,并基于识别出的相似性,确定出待识别图像中的对象。其中,底库中每一图像特征为针对一对象的图像特征。
相关技术中,训练用于进行对象分类的分类模型,待模型收敛后,将分类模型中的特征提取网络,确定为训练完成的特征提取网络,以用于后续的对象识别场景。
发明内容
本公开提供了一种特征提取网络的训练方法、装置及电子设备。
根据本公开的一方面,提供了一种特征提取网络的训练方法,包括:
获取训练集中的样本图像;
将所述样本图像输入分类模型,得到模型输出结果和所述样本图像的目标图像特征;其中,所述分类模型包括特征提取网络和全连接层,所述分类模型的全连接层用于建模各个目标类别,各个目标类别为所述训练集所覆盖的部分类别;
识别所述目标图像特征和指定特征的相似性,得到识别结果;其中,所述指定特征为属于辅助类别的图像的图像特征,各个目标类别和辅助类别中存在所述样本图像所属的类别;
利用所述模型输出结果与识别结果,生成所述样本图像的类别预测结果;
基于所述类别预测结果和所述样本图像的类别标签,对所述分类模型的模型参数进行调整,并返回所述获取训练集中样本图像的步骤,直至模型收敛,得到训练完成的特征提取网络。
根据本公开的另一方面,提供了一种特征提取网络的训练装置,包括:
获取模块,用于获取训练集中的样本图像;
输入模块,用于将所述样本图像输入分类模型,得到模型输出结果和所述样本图像的目标图像特征;其中,所述分类模型包括特征提取网络和全连接层,所述分类模型的全连接层用于建模各个目标类别,各个目标类别为所述训练集所覆盖的部分类别;
识别模块,用于识别所述目标图像特征和指定特征的相似性,得到识别结果;其中,所述指定特征为属于辅助类别的图像的图像特征,各个目标类别和辅助类别中存在所述样本图像所属的类别;
生成模块,用于利用所述模型输出结果与识别结果,生成所述样本图像的类别预测结果;
调整模块,用于基于所述类别预测结果和所述样本图像的类别标签,对所述分类模型的模型参数进行调整,并返回所述获取训练集中样本图像的步骤,直至模型收敛,得到训练完成的特征提取网络。
根据本公开的另一方面,提供了一种电子设备,包括:
至少一个处理器;以及
与所述至少一个处理器通信连接的存储器;其中,
所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行上述特征提取网络的训练方法。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京百度网讯科技有限公司,未经北京百度网讯科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210030447.8/2.html,转载请声明来源钻瓜专利网。