[发明专利]一种针对深度神经网络DNN训练问题的错误定位方法在审

申请号：	202310284459.8	申请日：	2023-03-22
公开（公告）号：	CN116383046A	公开（公告）日：	2023-07-04
发明（设计）人：	文万志;吴涛;王楚越;陈希希;詹广生;程实	申请（专利权）人：	南通大学
主分类号：	G06F11/36	分类号：	G06F11/36;G06F11/07;G06N3/08;G06N3/084;G06N3/04;G06N3/048;G06F18/2433
代理公司：	南京经纬专利商标代理有限公司 32200	代理人：	王毅
地址：	226000 江苏省南通市崇***	国省代码：	江苏;32
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	一种针对深度神经网络 dnn 训练问题错误定位方法
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【说明书】：

本发明属于DNN错误定位技术领域，具体涉及一种针对深度神经网络DNN训练问题的错误定位方法。本发明包括以下步骤：S1、DNN模型准备；S2、DNN训练监控和数据收集；S3、第一次错误识别ADetection；S4、第二次错误识别DDetection；S5、错误定位ASTAnalysis。本发明提出的方法，可以精确地定位常见的DNN训练问题中的bug，该方法能有效提高定位DNN训练问题中的bug的效率，减少模型训练和调试的时间。本发明能够帮助软件开发人员提高DNN模型训练的效率，找到性能更好的DNN模型，进而改进软件的性能。

技术领域

本发明属于DNN错误定位技术领域，具体涉及一种针对深度神经网络DNN训练问题的错误定位方法。

背景技术

在深度神经网络快速发展的过程中，现有的神经网络技术缺乏定位DNN中bug的能力。主要是因为很多DNN存在缺陷，开发人员对DNN模型行为的理解不到位，而且现有的DNN调试工具不能够快速并且精确地定位DNN训练问题中的bug。所以，需要这种技术来解决DNN训练问题的bug。

DNN的错误定位技术可以很好的帮助开发人员有效的定位DNN的错误。最近，研究人员提出了一些关于DNN错误定位技术，然而，这些方法对DNN的错误定位不够精确。

发明内容

为解决上述现有技术存在的技术问题，本发明提出了一种针对深度神经网络DNN训练问题的错误定位方法，该方法能够精确定位DNN的训练问题中的bug，能够帮助软件开发人员提高DNN模型训练的效率，找到性能更好的DNN模型，进而改进软件的性能。

本发明为实现上述发明目的，采取的技术方案如下：

一种针对深度神经网络DNN训练问题的错误定位方法，包括以下步骤：S1、DNN模型准备；S2、DNN训练监控和数据收集；S3、第一次错误识别ADetection；S4、第二次错误识别DDetection；S5、错误定位ASTAnalysis。

进一步的作为本发明的优选技术方案，所述S1的具体步骤包括：S1.1、通过关键词bug等同义词进行搜索DNNbug模型；S1.2、删除一些得分低的DNNbug模型；S1.3、检查搜索到的DNN bug模型是否包含补丁或者修复结果；当检查搜索到的DNNbug模型未包含补丁或者修复结果时，删除该未包含补丁或者修复结果的DNN bug模型；S1.4、检查DNN bug模型中是否包含有初始化器、批量大小、激活函数、学习率、优化器、损失函数、精确率、迭代次数、批处理的必要模型参数；当检查DNNbug模型中未包含有初始化器、批量大小、激活函数、学习率、优化器、损失函数、精确率、迭代次数、批处理的必要模型参数时，删除该未包含有初始化器、批量大小、激活函数、学习率、优化器、损失函数、精确率、迭代次数、批处理的必要模型参数的DNNbug模型；S1.5、获得有效的DNNbug模型用来进行错误定位并获得有效的DNNbug的修复结果用来对错误定位的结果进行检验。

进一步的作为本发明的优选技术方案，所述S2在DNN模型训练时利用回调方法监控模型并收集数据，收集的相关数据如下：S2.1、模型定义，包括层及其配置；S2.2、模型使用的优化方法的定义及其参数；S2.3、模型训练准确率和损失值；S2.4、计算每个神经元的梯度；S2.5、模型的超参数和训练中使用的其他必要变量。

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于南通大学，未经南通大学许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/pat/books/202310284459.8/2.html，转载请声明来源钻瓜专利网。

上一篇：一种超清大靶面热漂移稳定辅助驾驶光学系统
下一篇：拱形结构纤维基摩擦电/压电复合纳米发电机以及鞋垫

同类专利

专利分类

G 物理

G06 计算；推算；计数
G06F 电数字数据处理
G06F11-00 错误检测；错误校正；监控
G06F11-07 .响应错误的产生，例如，容错
G06F11-22 .在准备运算或者在空闲时间期间内，通过测试作故障硬件的检测或定位
G06F11-28 .借助于检验标准程序或通过处理作错误检测、错误校正或监控
G06F11-30 .监控
G06F11-36 .通过软件的测试或调试防止错误

免登录下载普通用户下载升级VIP会员，免费下载

[发明专利]一种针对深度神经网络DNN训练问题的错误定位方法在审

专利文献下载