[发明专利]利用黑盒模拟器进行神经网络处理器设计的方法有效
申请号: | 201711034124.1 | 申请日: | 2017-10-30 |
公开(公告)号: | CN109726805B | 公开(公告)日: | 2021-02-09 |
发明(设计)人: | 不公告发明人 | 申请(专利权)人: | 上海寒武纪信息科技有限公司 |
主分类号: | G06N3/063 | 分类号: | G06N3/063 |
代理公司: | 中科专利商标代理有限责任公司 11021 | 代理人: | 任岩 |
地址: | 201203 上海浦东*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 利用 黑盒 模拟器 进行 神经网络 处理器 设计 方法 | ||
本公开提供了一种利用黑盒模拟器进行神经网络处理器设计的方法,包括:选取至少一组合作为神经网络模型的输入,设定至少一处理器设计目标作为神经网络模型的输出;根据所述输入及输出训练神经网络模型;利用训练后的神经网络模型对不同的处理器进行预测,确定满足所述处理器设计目标的处理器。本公开还提供了一种神经网络处理器及一种芯片。本公开利用黑盒模拟器进行神经网络处理器设计的方法、神经网络处理器及芯片,能够快速有效的从不同设计参数组合和不同精确度的运算器组合中得到满足给定设计需求的最佳的设计结构。
技术领域
本公开涉及人工智能技术领域,尤其涉及一种利用黑盒模拟器进行神经网络处理器设计的方法。
背景技术
深度神经网络是目前许多人工智能应用的基础,其在语音识别、图像处理、数据分析、广告推荐系统、汽车自动驾驶等多方面得到了突破性的应用,使得深度神经网络被应用在了生活的各个方面。
然而深度神经网络的运算量巨大,运算时间过长,一直制约着其更快速的发展和更广泛的应用。于是,很多设计者开始研发针对深度神经网络的专用处理器。同时,很多深度神经网络算法被应用在了广泛的领域,而这些领域对结果的精度要求并不相同,很多无需非常高的精度。所以,在处理器的设计过程中,设计者面临在各种约束目标(如功耗、面积、可靠性等)下如何使所设计的处理器能够达到最佳的性能和满足精度要求的问题。
发明内容
(一)要解决的技术问题
为了解决或者至少部分缓解上述技术问题,本公开提供了一种利用黑盒模拟器进行神经网络处理器设计空间探索的方法。即,利用某种常用的算法,算法包括卷积神经网络、支持向量机、决策树等,来模拟采用不同或相同的精确度运算器(包括精确运算器和/或非精确运算器,例如精确乘法器、精确加法器、非精确乘法器、非精确加法器等)等时神经网络处理器的性能、准确度等数据,从而能够快速有效的从不同设计参数组合和不同精确度的运算器组合中得到满足给定设计需求的最佳的设计结构。
(二)技术方案
根据本公开的一个方面,提供了一种利用黑盒模拟器进行神经网络处理器设计的方法,包括:选取至少一组合作为神经网络模型的输入,设定至少一处理器设计目标作为神经网络模型的输出;根据所述输入及输出训练神经网络模型;以及利用训练后的神经网络模型对不同的处理器进行预测,确定满足所述处理器设计目标的处理器。
在一些实施例中,所述神经网络处理器设计为非精确神经网络处理器设计。
在一些实施例中,所述组合包括参数组合和/或运算器组合。
在一些实施例中,所述处理器设计目标包括以下至少其中之一:精度目标、功耗目标、速度目标及面积目标。
在一些实施例中,所述参数组合为处理器的设计参数组合,包括以下至少其中之一:用于片上存储的规模及位宽、数据传输的带宽及主频。
在一些实施例中,所述运算器组合包括乘法器和/或加法器的组合。
在一些实施例中,在所述选取至少一组合作为神经网络模型的输入的步骤之前,还包括:选定一算法及其配置,并进行初始化。
在一些实施例中,所述配置包括预定误差阈值、预定迭代次数阈值;所述初始化包括权值、偏移量参数初始化。
在一些实施例中,所述算法包括卷积神经网络、支持向量机、决策树。
在一些实施例中,所述根据所述输入及输出训练神经网络模型的步骤,包括:训练神经网络模型,得到预测输出;计算预测输出和真实输出之间的误差,并与一预定误差阈值进行比较;若预测输出和真实输出之间的误差小于或等于预定误差阈值,则结束对神经网络模型的训练;否则重复训练神经网络模型,直至迭代次数达到一预定迭代次数阈值。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海寒武纪信息科技有限公司,未经上海寒武纪信息科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201711034124.1/2.html,转载请声明来源钻瓜专利网。