[发明专利]一种基于反正切损失函数的目标分类方法在审
申请号: | 202310052143.6 | 申请日: | 2023-02-02 |
公开(公告)号: | CN116028866A | 公开(公告)日: | 2023-04-28 |
发明(设计)人: | 赵振兵;陈浩天;聂礼强;戴永东;翟永杰;赵文清 | 申请(专利权)人: | 华北电力大学(保定);山东大学;国网江苏省电力有限公司泰州供电分公司 |
主分类号: | G06F18/241 | 分类号: | G06F18/241;G06F18/214;G06N3/045;G06N3/08 |
代理公司: | 北京鑫瑞森知识产权代理有限公司 11961 | 代理人: | 王前明 |
地址: | 071003 河*** | 国省代码: | 河北;13 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 正切 损失 函数 目标 分类 方法 | ||
本发明提供了一种基于反正切损失函数的目标分类方法,该方法包括:选择数据集,并定义数据集的标签,对孪生网络的损失函数进行调整,用于减小同类样本特征的距离,增大不同类别样本特征的距离,得到调整后的孪生网络,通过数据集对孪生网络进行训练,直至孪生网络收敛,并对训练后的孪生网络进行测试。本发明提供的基于反正切损失函数的目标分类方法,能够减少网络训练周期,能够加速网络收敛。
技术领域
本发明涉及孪生网络目标分类技术领域,特别是涉及一种基于反正切损失函数的目标分类方法。
背景技术
深度学习已经在各个领域取得了非常优异的表现。传统的基于深度学习的方法需要大量的样本进行训练,当样本不充分时,模型性能将严重下降。现实中,并不都能获得大量的样本,且样本往往呈现出类别多、样本少的特点。为了解决上述问题,针对少样本、多类别的分类方法研究逐渐深入,孪生网络便是其中之一。
孪生网络以两个样本为输入,输出其高维空间的特征,用来比较两个样本的相似程度,简单来说,可以最小化同类样本的距离,最大化不同类之间的距离。在使用基于孪生网络进行目标分类任务时,由于其经典损失函数的不合理性,导致网络训练周期长、难以收敛。为解决该问题,提出一种基于反正切损失函数的目标分类方法是十分有必要的。
发明内容
本发明的目的是提供一种基于反正切损失函数的目标分类方法,能够减少网络训练周期,能够加速网络收敛。
为实现上述目的,本发明提供了如下方案:
一种基于反正切损失函数的目标分类方法,包括如下步骤:
步骤1:选择数据集,并定义数据集的标签;
步骤2:对孪生网络的损失函数进行调整,用于减小同类样本特征的距离,增大不同类别样本特征的距离,得到调整后的孪生网络;
步骤3:通过数据集对孪生网络进行训练,直至孪生网络收敛,并对训练后的孪生网络进行测试。
可选的,步骤1中,选择数据集,并定义数据集的标签,具体为:
选择公共无标注数据集Omniglot,将其划分为训练集及测试集,并定义样本标签。
可选的,步骤2中,对孪生网络的损失函数进行调整,用于减小同类样本特征的距离,增大不同类别样本特征的距离,得到调整后的孪生网络,具体为:
结合二分类交叉熵损失函数及反正切函数,设计反正切损失函数为:
式中,yn为样本标签,用0表示同类样本,1表示不同类的样本,xn表示经过孪生网络输出的特征距离,通过将特征做差得到;
当孪生网络输入同类样本时,此时标签为0,反正切损失函数的表达式变为:
当孪生网络输入不同类别的样本时,此时标签为1,反正切损失函数的表达式变为:
根据反正切损失函数对孪生网络的损失函数进行调整,得到调整后的孪生网络。
可选的,步骤3中,通过数据集对孪生网络进行训练,直至孪生网络收敛,并对训练后的孪生网络进行测试,具体为:
通过训练集及测试集对调整后的孪生网络进行训练,直至孪生网络收敛,绘制训练集和测试集上的损失函数曲线及准确率曲线,对训练后的孪生网络进行测试,验证反正切损失函数是否准确度量样本的距离。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华北电力大学(保定);山东大学;国网江苏省电力有限公司泰州供电分公司,未经华北电力大学(保定);山东大学;国网江苏省电力有限公司泰州供电分公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202310052143.6/2.html,转载请声明来源钻瓜专利网。