“合肥君正科技有限公司”申请（专利权）人搜索_中国专利权人_发明人_技术持有人_科研专家_钻瓜专利网

钻瓜专利网为您找到相关结果145个，建议您升级VIP下载更多相关专利

[发明专利]一种基于NNA的输入层数据排序方法-CN202210320414.7在审
发明人：李岩 -专利权人： 合肥君正科技有限公司
申请日： 2022-03-29 - 公布日： 2023-10-27 - 主分类号： G06F17/15 文献下载
摘要：本发明提供一种基于NNA的输入层数据排序方法，所述方法是结合NNA的MAC运算的特性和输入层FeatureMap只有4个通道的属性，通过对卷积运算数据进行重排序，使得每次MAC运行的32个通道包含有效数据的效率最大，即把输入层一次N*N卷积对应的输入FeatureMap有效数据量通过排序来等价转化为1*1卷积。为了充分利用起来NNA在进行MAC运算时通道上的冗余运算，同时也为了降低每次MAC的运算时间。将卷积核对应的输入FeatureMap的真实有效数据进行排序，把有效数据在通道上进行排列，使得每次MAC运行的32个通道尽可能多地包含有效数据。
一种基于 nna 输入数据排序方法

[发明专利]一种逐通道卷积的实现方法-CN202210320433.X在审
发明人：刘子航;王荔枝 -专利权人： 合肥君正科技有限公司
申请日： 2022-03-29 - 公布日： 2023-10-27 - 主分类号： G06N3/063 文献下载
摘要：本发明提供一种逐通道卷积的实现方法，所述方法在遇到逐通道卷积时，通过对卷积核扩展来实现NNA卷积加速，扩展后的多通道卷积核，每个卷积核的通道数等于输入通道数，卷积核个数等于输入通道数；为了保证卷积核扩展后得到的卷积结果和逐通道卷积结果一致，需要计算扩展后除对应通道外其余通道元素的填充值。
一种通道卷积实现方法

[发明专利]一种基于NNA的fc层地址非连续的输入数据处理方法-CN202210322719.1在审
发明人：倪照风;王荔枝 -专利权人： 合肥君正科技有限公司
申请日： 2022-03-29 - 公布日： 2023-10-27 - 主分类号： G06F3/06 文献下载
摘要：本发明提供一种基于NNA的fc层地址非连续的输入数据处理方法，所述方法通过DMA搬运多余废数据来保证搬运数据64字节对齐，将搬运的数据存到ORAM空间，用于NNA计算。克服由运用DMA搬运数据带来的输入FeatureMap字节对齐问题，解决在全连接层数据行对齐的情况下，使用DMA正确的搬运数据。将权重、输入数据按行分块计算，减少数据搬运、计算之间的等待时间。
一种基于 nna fc 地址连续输入数据处理方法

[发明专利]一种基于NNA的depthwise权重的处理方法-CN202210322758.1在审
发明人：刘子航 -专利权人： 合肥君正科技有限公司
申请日： 2022-03-29 - 公布日： 2023-10-27 - 主分类号： G06N3/0464 文献下载
摘要：本发明提供一种基于NNA的depthwise权重的处理方法，所述方法在遇到depthwise卷积时，通过进行卷积核扩展来实现NNA卷积加速，所述卷积核扩展是NNA要求卷积核输入通道数是32的倍数，通过对卷积核进行通道扩展实现NNA卷积加速，为了保证卷积核扩展后得到的卷积结果和depthwise卷积结果一致，除对应输入通道外其余输入通道元素值均填充为0。实现对depthwise卷积的快速运算。
一种基于 nna depthwise 权重处理方法

[发明专利]一种基于NNA的支持focus操作的卷积实现方法-CN202210322774.0在审
发明人：李岩;王荔枝 -专利权人： 合肥君正科技有限公司
申请日： 2022-03-29 - 公布日： 2023-10-27 - 主分类号： G06N3/0464 文献下载
摘要：本发明提供一种基于NNA的支持focus操作的卷积实现方法，包括：S1，假定网络中存在2个连续层，focus层后紧接着为卷积层，并且卷积层进行卷积核为kernelX*kernelY的卷积，卷积步长为strideX*strideY，其中，kernelX、kernelY是未结合之前卷积层的卷积核在X、Y方向上的大小，strideX、strideY为未结合之前卷积层在X、Y方向上的卷积步长；S2,在把所述focus和卷积层进行合并，合并之后等价于在未进行focus操作的FeatureMap上进行卷积核为(2*kernelX)*(2*kernelY)的卷积，卷积步长为(2*strideX)*(2*strideY)；S3，通过对每次卷积对应的输入FeatureMap数据进行重排序，把卷积核大小(2*kernelX)*(2*kernelY)且步长(2*strideX)*(2*strideY)的卷积等价的转化为大小1*1步长1*1的卷积，使得focus层和输入层结合后能够在NNA上正常实现。
一种基于 nna 支持 focus 操作卷积实现方法

[发明专利]一种基于NNA的fc层地址连续的输入数据处理方法-CN202210322756.2在审
发明人：倪照风;王荔枝 -专利权人： 合肥君正科技有限公司
申请日： 2022-03-29 - 公布日： 2023-10-27 - 主分类号： G06F3/06 文献下载
摘要：本发明提供一种基于NNA的fc层地址连续的输入数据处理方法，所述方法中地址连续无需考虑行对齐，克服由运用DMA搬运数据带来的输入FeatureMap iline_size 64字节对齐，解决在全连接层数据非对齐的情况下，使用DMA正确的搬运数据。无需搬运多余元素。
一种基于 nna fc 地址连续输入数据处理方法

[发明专利]一种基于NNA的1xN卷积的实现方法-CN202210320413.2在审
发明人：刘子航 -专利权人： 合肥君正科技有限公司
申请日： 2022-03-29 - 公布日： 2023-10-27 - 主分类号： G06N3/0464 文献下载
摘要：本发明提供一种基于NNA的1xN卷积的实现方法，在不满足NNA相关参数范围时，通过对输入图像和卷积核矩阵进行拆分、重组、累加来实现NNA卷积加速，其中，卷积核拆分：对于1xN卷积，当N大于3时，超出了NNA寄存器参数范围，通过卷积核拆分实现NNA卷积加速；还包括NNA寄存器配置：使用NNA进行卷积加速必须正确配置NNA相关寄存器、卷积的步长、卷积核大小的必要参数都通过NNA寄存器进行配置，这些参数都必须在NNA支持的参数范围内才能得到正确的卷积结果。通过配置相关寄存器参数实现卷积核矩阵维度≤3x3的卷积计算加速，从而大幅度减少神经网络运行时间，在实际应用中实时性更高，用户体验更好。在不满足NNA相关参数范围时，保证通用性又能提高卷积运算速度。
一种基于 nna xn 卷积实现方法

[发明专利]一种基于NNA的降低边界计算量的效率优化方法-CN202210322751.X在审
发明人：李岩;王荔枝 -专利权人： 合肥君正科技有限公司
申请日： 2022-03-29 - 公布日： 2023-10-27 - 主分类号： G06N3/063 文献下载
摘要：本发明提供一种基于NNA的降低边界计算量的效率优化方法，所述方法在利用NNA进行卷积计算时，遇到卷积的边界时，如果MAC计算产生冗余计算从而产生真实输出点和非真实输出点，根据边界非真实输出点和输出FeatureMap的宽度占比高低来决定能否通过忽略边界判断来提升代码执行效率。在利用NNA进行卷积计算遇到的边界时，并不是总可以通过忽略边界的方式来提高代码执行效率，有时，忽略边界的计算反而会拉低代码的效率。本申请的目的是为表明不同的情况下，忽略卷积的边界计算带来的影响。
一种基于 nna 降低边界计算效率优化方法

[发明专利]一种神经网络模型权重参数优化对齐的方法-CN202210314739.4在审
发明人：王丽泉 -专利权人： 合肥君正科技有限公司
申请日： 2022-03-28 - 公布日： 2023-10-17 - 主分类号： G06N3/082 文献下载
摘要：本发明提供一种神经网络模型权重参数优化对齐的方法，所述方法包括：S1，确定需要对齐节点的类型并根据节点类型在函数map中选择对应处理函数；S2，确定图中兄弟节点、子节点类型：如果是非concat节点直接从对齐map中选择对齐函数，对齐后退出；如果是concat节点对齐则需要更改其concat子节点的输入通道数，如果是concat子节点且是卷积节点则更改输入通道后可直接退出，如果是concat子节点且是池化节点则需要更改其孙子节点的输入通道；如果子节点是有两个输入节点的add节点或者mul节点则采用复杂对齐及其递归分析；S3，对齐完成并逐层退出。在对神经网络模型进行转换适配时，这些对齐的目的是为了更快的进行数据搬运和充分利用缓存空间，从而加快神经网络模型的推理速度。
一种神经网络模型权重参数优化对齐方法

[发明专利]一种神经网络截断推理的方法-CN202210314743.0在审
发明人：王丽泉 -专利权人： 合肥君正科技有限公司
申请日： 2022-03-28 - 公布日： 2023-10-13 - 主分类号： G06N3/044 文献下载
摘要：本发明提供一种神经网络截断推理的方法，所述方法的实施步骤包括：S1，由高级IR转换为中级IR并进行数据和图优化，优化完成初始化中级IR的数据结构的各个成员变量；S2，根据用户设置的起止点动态从节点池中选择输出节点并由输出节点开始递归执行，执行过程中提供空间的利用选项和错误检查功能；S3，推理完成并重置各个节点属性，准备下一次推理。除了完成任意起始点推理的基本功能外，本发明还提供了高效内存利用的选项来随时释放后续不需要用到的空间。
一种神经网络截断推理方法

[发明专利]一种基于色温和照度的自适应镜头阴影校正方法及系统-CN202011048902.4有效
发明人：冯广 -专利权人： 合肥君正科技有限公司
申请日： 2020-09-29 - 公布日： 2023-09-26 - 主分类号： H04N23/81 文献下载
摘要：本发明提供一种基于色温和照度的自适应镜头阴影校正方法，包括：S1获取视频画面的待校正原始图像，保证图像亮度处于人眼视觉的程度；S2提取待校正图像四个通道，包括红色通道R、绿色通道Gr和Gb，蓝色通道B；S3计算图像四个通道校正系数，包括R_gain；Gr_gain和Gb_gain；B_gain；公式：R_gain＝R_gain_org*R_stren；Gr_gain＝Gr_gain_org*Gr_stren；Gb_gain＝Gb_gain_org*Gb_stren；B_gain＝B_gain_org*B_stren；其中R_gain、Gr_gain、Gb_gain和B_gain分别为对应通道校正系数；R_stren、Gr_stren、Gb_stren和B_stren分别是对应的校正强度，R_gain_org、B_gain_org、Gr_gain_org和Gb_gain_org分别是对应通道的静态校正系数；S4，针对图像四个通道进行校正，相应位置的系数通过查表并计算得到如公式：r＝R*R_gain；gr＝Gr*Gr_gain；gb＝Gb*Gb_gain；b＝B*B_gain。
一种基于色温照度自适应镜头阴影校正方法系统

[发明专利]一种适应于神经网络处理器协同工作的方法和装置-CN201811117531.3有效
发明人：翟云 -专利权人： 合肥君正科技有限公司
申请日： 2018-09-20 - 公布日： 2023-08-18 - 主分类号： G06F9/50 文献下载
摘要：本发明提供了一种适应于神经网络处理器协同工作的方法和装置，其中，该方法包括：神经网络处理器通过神经网络的第一网络层对第一信道的数据进行处理，得到第一信道的第一处理结果，其中，第一网络层中有多个信道；所述神经网络处理器将所述第一网络层第一信道的第一处理结果即刻提供给外部处理器，以使所述外部处理器根据所述第一网络层第一信道的第一处理结果进行处理，得到第一信道的第二处理结果；所述神经网络处理器获取所述第一信道的第二处理结果，通过所述神经网络的第二网络层对所述第一信号的第二处理结果进行处理，得到第一信道的第三处理结果。通过上述方案避免了因为需要等所有信道数据都处理完成之后再触发下一层进行处理，而导致的处理效率低下的问题，达到了有效提升处理效率的技术效果。
一种适应神经网络处理器协同工作方法装置

[发明专利]一种NPU与主CPU的数据交互方法和装置-CN201811100248.X有效
发明人：翟云 -专利权人： 合肥君正科技有限公司
申请日： 2018-09-20 - 公布日： 2023-08-18 - 主分类号： G06N3/063 文献下载
摘要：本发明提供了一种NPU与主CPU的数据交互方法和装置，其中，该方法包括：NPU监测所述NPU中的task‑out ID寄存器中是否被写入新的信道标识；在确定所述task‑out ID寄存器中被写入新的信道标识的情况下，向主CPU发送中断信号；其中，所述主CPU响应于所述中断信号从所述task‑out ID寄存器中读取所述新的信道标识，对所述新的信道标识所指示的信道进行逐点取反操作。在上述方案中，通过设置寄存器，在某个信道完成操作之后，将该信道标识写入该寄存器中，通过寄存器中信道标识的变化，来触发对该信道的下一步处理，从而使得NPU与主CPU可以达到任务流水线的效果，提升了数据传输效率和数据处理效率。
一种 npu cpu 数据交互方法装置

[发明专利]一种低比特神经网络输入源相加层优化的实现方法-CN202210064878.6在审
发明人：倪照风 -专利权人： 合肥君正科技有限公司
申请日： 2022-01-20 - 公布日： 2023-08-01 - 主分类号： G06F9/30 文献下载
摘要：本发明提供一种低比特神经网络输入源相加层优化的实现方法，所述方法通过使用SIMD指令对数据进行并行计算，对低比特数据进行神经网络输入源相加层加速，即优化数据比特bit位宽，将低bit数据相加，结果移位，以及利用bankround计算逻辑，对结果进行移位，得到小数与奇偶标志位，判断最后是否需要加1，全部计算基于SIMD低比特指令，将乘法转换为移位指令，浮点转换为低比特整形，通过操作，完成对结果的奇偶判断，最终实现低比特神经网络输入源相加层优化。
一种比特神经网络输入相加优化实现方法

[发明专利]一种基于图像特性的编码单元的划分方法-CN202210078424.4在审
发明人：苏子健 -专利权人： 合肥君正科技有限公司
申请日： 2022-01-24 - 公布日： 2023-08-01 - 主分类号： H04N19/139 文献下载
摘要：本发明提供一种基于图像特征的编码单元的划分方法，设CTU大小为32x32；对CTU32的四子块CU16进行平坦文理边缘的分类，并记录其分类状态，通过分类状态进行划分；使用sobel算子和子块方差进行阈值判断，从而确定当前块的平坦、边缘、纹理类型，通过当前块的类型给出对应的划分策略。对边缘块进行划分，平坦块不划分而纹理块依据RDcost划分更能提升人眼的主观感受。同时，节省了码流，也让划分方式随着qp变化更加合理。且多个树编码单元CTU独立划分，可以做到并行操作。使用sobel和子块方差联合的方法确定当前块的平坦、边缘、纹理类型。通过当前块的类型给出对应的划分策略，在更符合人眼主观感受的同时提高视频的压缩效率。
一种基于图像特性编码单元划分方法

1
2
3
4
5
6
7
8
9
10
下一页»
尾页
共 145 条