|
钻瓜专利网为您找到相关结果 145个,建议您 升级VIP下载更多相关专利
- [发明专利]一种基于NNA的输入层数据排序方法-CN202210320414.7在审
-
李岩
-
合肥君正科技有限公司
-
2022-03-29
-
2023-10-27
-
G06F17/15
- 本发明提供一种基于NNA的输入层数据排序方法,所述方法是结合NNA的MAC运算的特性和输入层FeatureMap只有4个通道的属性,通过对卷积运算数据进行重排序,使得每次MAC运行的32个通道包含有效数据的效率最大,即把输入层一次N*N卷积对应的输入FeatureMap有效数据量通过排序来等价转化为1*1卷积。为了充分利用起来NNA在进行MAC运算时通道上的冗余运算,同时也为了降低每次MAC的运算时间。将卷积核对应的输入FeatureMap的真实有效数据进行排序,把有效数据在通道上进行排列,使得每次MAC运行的32个通道尽可能多地包含有效数据。
- 一种基于nna输入数据排序方法
- [发明专利]一种基于NNA的支持focus操作的卷积实现方法-CN202210322774.0在审
-
李岩;王荔枝
-
合肥君正科技有限公司
-
2022-03-29
-
2023-10-27
-
G06N3/0464
- 本发明提供一种基于NNA的支持focus操作的卷积实现方法,包括:S1,假定网络中存在2个连续层,focus层后紧接着为卷积层,并且卷积层进行卷积核为kernelX*kernelY的卷积,卷积步长为strideX*strideY,其中,kernelX、kernelY是未结合之前卷积层的卷积核在X、Y方向上的大小,strideX、strideY为未结合之前卷积层在X、Y方向上的卷积步长;S2,在把所述focus和卷积层进行合并,合并之后等价于在未进行focus操作的FeatureMap上进行卷积核为(2*kernelX)*(2*kernelY)的卷积,卷积步长为(2*strideX)*(2*strideY);S3,通过对每次卷积对应的输入FeatureMap数据进行重排序,把卷积核大小(2*kernelX)*(2*kernelY)且步长(2*strideX)*(2*strideY)的卷积等价的转化为大小1*1步长1*1的卷积,使得focus层和输入层结合后能够在NNA上正常实现。
- 一种基于nna支持focus操作卷积实现方法
- [发明专利]一种基于NNA的1xN卷积的实现方法-CN202210320413.2在审
-
刘子航
-
合肥君正科技有限公司
-
2022-03-29
-
2023-10-27
-
G06N3/0464
- 本发明提供一种基于NNA的1xN卷积的实现方法,在不满足NNA相关参数范围时,通过对输入图像和卷积核矩阵进行拆分、重组、累加来实现NNA卷积加速,其中,卷积核拆分:对于1xN卷积,当N大于3时,超出了NNA寄存器参数范围,通过卷积核拆分实现NNA卷积加速;还包括NNA寄存器配置:使用NNA进行卷积加速必须正确配置NNA相关寄存器、卷积的步长、卷积核大小的必要参数都通过NNA寄存器进行配置,这些参数都必须在NNA支持的参数范围内才能得到正确的卷积结果。通过配置相关寄存器参数实现卷积核矩阵维度≤3x3的卷积计算加速,从而大幅度减少神经网络运行时间,在实际应用中实时性更高,用户体验更好。在不满足NNA相关参数范围时,保证通用性又能提高卷积运算速度。
- 一种基于nnaxn卷积实现方法
- [发明专利]一种神经网络模型权重参数优化对齐的方法-CN202210314739.4在审
-
王丽泉
-
合肥君正科技有限公司
-
2022-03-28
-
2023-10-17
-
G06N3/082
- 本发明提供一种神经网络模型权重参数优化对齐的方法,所述方法包括:S1,确定需要对齐节点的类型并根据节点类型在函数map中选择对应处理函数;S2,确定图中兄弟节点、子节点类型:如果是非concat节点直接从对齐map中选择对齐函数,对齐后退出;如果是concat节点对齐则需要更改其concat子节点的输入通道数,如果是concat子节点且是卷积节点则更改输入通道后可直接退出,如果是concat子节点且是池化节点则需要更改其孙子节点的输入通道;如果子节点是有两个输入节点的add节点或者mul节点则采用复杂对齐及其递归分析;S3,对齐完成并逐层退出。在对神经网络模型进行转换适配时,这些对齐的目的是为了更快的进行数据搬运和充分利用缓存空间,从而加快神经网络模型的推理速度。
- 一种神经网络模型权重参数优化对齐方法
- [发明专利]一种基于色温和照度的自适应镜头阴影校正方法及系统-CN202011048902.4有效
-
冯广
-
合肥君正科技有限公司
-
2020-09-29
-
2023-09-26
-
H04N23/81
- 本发明提供一种基于色温和照度的自适应镜头阴影校正方法,包括:S1获取视频画面的待校正原始图像,保证图像亮度处于人眼视觉的程度;S2提取待校正图像四个通道,包括红色通道R、绿色通道Gr和Gb,蓝色通道B;S3计算图像四个通道校正系数,包括R_gain;Gr_gain和Gb_gain;B_gain;公式:R_gain=R_gain_org*R_stren;Gr_gain=Gr_gain_org*Gr_stren;Gb_gain=Gb_gain_org*Gb_stren;B_gain=B_gain_org*B_stren;其中R_gain、Gr_gain、Gb_gain和B_gain分别为对应通道校正系数;R_stren、Gr_stren、Gb_stren和B_stren分别是对应的校正强度,R_gain_org、B_gain_org、Gr_gain_org和Gb_gain_org分别是对应通道的静态校正系数;S4,针对图像四个通道进行校正,相应位置的系数通过查表并计算得到如公式:r=R*R_gain;gr=Gr*Gr_gain;gb=Gb*Gb_gain;b=B*B_gain。
- 一种基于色温照度自适应镜头阴影校正方法系统
- [发明专利]一种适应于神经网络处理器协同工作的方法和装置-CN201811117531.3有效
-
翟云
-
合肥君正科技有限公司
-
2018-09-20
-
2023-08-18
-
G06F9/50
- 本发明提供了一种适应于神经网络处理器协同工作的方法和装置,其中,该方法包括:神经网络处理器通过神经网络的第一网络层对第一信道的数据进行处理,得到第一信道的第一处理结果,其中,第一网络层中有多个信道;所述神经网络处理器将所述第一网络层第一信道的第一处理结果即刻提供给外部处理器,以使所述外部处理器根据所述第一网络层第一信道的第一处理结果进行处理,得到第一信道的第二处理结果;所述神经网络处理器获取所述第一信道的第二处理结果,通过所述神经网络的第二网络层对所述第一信号的第二处理结果进行处理,得到第一信道的第三处理结果。通过上述方案避免了因为需要等所有信道数据都处理完成之后再触发下一层进行处理,而导致的处理效率低下的问题,达到了有效提升处理效率的技术效果。
- 一种适应神经网络处理器协同工作方法装置
- [发明专利]一种NPU与主CPU的数据交互方法和装置-CN201811100248.X有效
-
翟云
-
合肥君正科技有限公司
-
2018-09-20
-
2023-08-18
-
G06N3/063
- 本发明提供了一种NPU与主CPU的数据交互方法和装置,其中,该方法包括:NPU监测所述NPU中的task‑out ID寄存器中是否被写入新的信道标识;在确定所述task‑out ID寄存器中被写入新的信道标识的情况下,向主CPU发送中断信号;其中,所述主CPU响应于所述中断信号从所述task‑out ID寄存器中读取所述新的信道标识,对所述新的信道标识所指示的信道进行逐点取反操作。在上述方案中,通过设置寄存器,在某个信道完成操作之后,将该信道标识写入该寄存器中,通过寄存器中信道标识的变化,来触发对该信道的下一步处理,从而使得NPU与主CPU可以达到任务流水线的效果,提升了数据传输效率和数据处理效率。
- 一种npucpu数据交互方法装置
- [发明专利]一种基于图像特性的编码单元的划分方法-CN202210078424.4在审
-
苏子健
-
合肥君正科技有限公司
-
2022-01-24
-
2023-08-01
-
H04N19/139
- 本发明提供一种基于图像特征的编码单元的划分方法,设CTU大小为32x32;对CTU32的四子块CU16进行平坦文理边缘的分类,并记录其分类状态,通过分类状态进行划分;使用sobel算子和子块方差进行阈值判断,从而确定当前块的平坦、边缘、纹理类型,通过当前块的类型给出对应的划分策略。对边缘块进行划分,平坦块不划分而纹理块依据RDcost划分更能提升人眼的主观感受。同时,节省了码流,也让划分方式随着qp变化更加合理。且多个树编码单元CTU独立划分,可以做到并行操作。使用sobel和子块方差联合的方法确定当前块的平坦、边缘、纹理类型。通过当前块的类型给出对应的划分策略,在更符合人眼主观感受的同时提高视频的压缩效率。
- 一种基于图像特性编码单元划分方法
|