[发明专利]一种优化填充参数的方法、装置、计算机可读存储介质在审
申请号: | 201911360230.8 | 申请日: | 2019-12-25 |
公开(公告)号: | CN111126585A | 公开(公告)日: | 2020-05-08 |
发明(设计)人: | 不公告发明人 | 申请(专利权)人: | 中科寒武纪科技股份有限公司 |
主分类号: | G06N3/063 | 分类号: | G06N3/063;G06N3/04;G06N3/08 |
代理公司: | 北京维昊知识产权代理事务所(普通合伙) 11804 | 代理人: | 李波;汪扬 |
地址: | 100000 北京市海*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 优化 填充 参数 方法 装置 计算机 可读 存储 介质 | ||
本公开涉及一种优化填充参数的方法、装置、计算机可读存储介质。其中优化填充参数的装置可以包括在组合处理装置中,该组合处理装置还可以包括通用互联接口和其他处理装置。优化填充参数的装置与其他处理装置进行交互,共同完成用户指定的计算操作。组合处理装置还可以包括存储装置,该存储装置分别与优化填充参数的装置和其他处理装置连接,用于优化填充参数的装置和其他处理装置的数据服务。借助于本公开的内容,克服了冗余现象的产生,降低了输入规模,减少了内存占用、提高了运算速度。
技术领域
本公开一般地涉及计算机领域。更具体地,涉及一种优化填充参数的方法、装置、计算机可读存储介质。
背景技术
Tensorflow是一个基于数据流编程(dataflow programming)的符号数学系统,被广泛应用于各类机器学习(machine learning)算法的编程实现。Pytorch是torch的python版本,是由脸书公司(Facebook)开源的神经网络框架。与Tensorflow的静态计算图不同,Pytorch的计算图是动态的,可以根据计算需要实时改变计算图。在目前人工智能领域中使用的Tensorflow框架和Pytorch框架中都常常在卷积运算中使用填充(补零)的添加方法。
但是在TensorFlow框架下填充(补零)无法被设置,故其填充方法存在较多的功能性缺陷,多种填充的情况无法实现。在Pytorch框架中允许将填充参数设置成任意非负整数值,不存在TensorFlow框架的功能性缺陷,但因其是在相应维度两端进行相同的填充或者补零,故存在冗余的现象。
如何至少解决现有技术中存在的部分缺陷,是本领域技术人员亟待解决的问题。
发明内容
为了至少解决在上述背景技术部分所描述的问题,以便克服冗余现象的产生,实现降低输入规模,减少内存占用、提高运算速度的效果,本公开提出了如下的技术方案及其多个实施例。
根据本公开的第一方面,提供了一种优化填充参数(padding)的方法,可以包括下面的步骤:
根据输入数据(input)计算输出数据(output)的输出尺寸(output_size);
根据输出尺寸和输入数据计算输入数据的有效的输入尺寸(equivalent_input_size);
根据有效的输入尺寸与输入数据中相应参数之间的比较计算优化后的填充参数(optimized_padding)。
根据本公开的第二方面,提供了一种用于优化填充参数的装置,可以包括:
处理器,其配置用于执行程序指令;以及
存储器,其配置用于存储程序指令,当程序指令由处理器加载并执行时,使得装置执行上述的方法。
根据本公开的第三方面,提供了一种计算机可读存储介质,其中存储有程序指令,程序指令适于由处理器加载并执行根据上述的方法。
根据本公开的第四方面,提供了一种用于优化填充参数的芯片,可以包括:输入端,其配置成用于接收输入数据;处理器,其配置成用于:根据输入数据计算输出数据的输出尺寸;根据输出尺寸和输入数据计算输入数据的有效的输入尺寸;根据有效的输入尺寸与输入数据中相应参数之间的比较计算优化后的填充参数。
根据本公开的第五方面,提供了一种用于优化填充参数的集成电路,包括根据上述的芯片。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中科寒武纪科技股份有限公司,未经中科寒武纪科技股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201911360230.8/2.html,转载请声明来源钻瓜专利网。