[发明专利]一种适用于高斯平滑的NEON优化方法在审
| 申请号: | 202210067301.0 | 申请日: | 2022-01-20 |
| 公开(公告)号: | CN114511477A | 公开(公告)日: | 2022-05-17 |
| 发明(设计)人: | 段罗淋 | 申请(专利权)人: | 上海盈方微电子有限公司 |
| 主分类号: | G06T5/20 | 分类号: | G06T5/20;G06F15/80 |
| 代理公司: | 上海愉腾专利代理事务所(普通合伙) 31306 | 代理人: | 唐海波 |
| 地址: | 201203 上海市浦东新区自由*** | 国省代码: | 上海;31 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 适用于 平滑 neon 优化 方法 | ||
1.一种适用于高斯平滑的NEON优化方法,其特征在于,所述方法包括以下步骤:
执行高斯平滑算法;
将每个点的权值系数读取到neon寄存器中;
将一预设的待乘值读取到neon寄存器中并向量化;
按行读取待计算点及其邻近域数据;
对待计算点及邻近域数据进行计算时,先乘以待乘值再进行移位操作。
2.根据权利要求1所述的适用于高斯平滑的NEON优化方法,其特征在于,所述高斯平滑算法为5×5高斯平滑算法,是以待计算点及其邻近域共计25个点的Y分量值分别乘上相应的权值后相加,再平均后得出待计算点最终结果。
3.根据权利要求2所述的适用于高斯平滑的NEON优化方法,其特征在于,所述5×5高斯平滑算法的待乘值设为78,需要先将78读取到寄存器中并做向量化。
4.根据权利要求3所述的适用于高斯平滑的NEON优化方法,其特征在于,所述向量化为16位向量化。
5.根据权利要求3所述的适用于高斯平滑的NEON优化方法,其特征在于,所述对待计算点及邻近域数据进行计算时,先乘以待乘值再进行移位操作包括:将sum=sum/52转换为sum=sum*7812。
6.根据权利要求2所述的适用于高斯平滑的NEON优化方法,其特征在于,所述按行读取待计算点及其邻近域数据包括:至少需要读取5次数据,考虑到neon的寄存器个数,选择每行每次读取24字节。
7.根据权利要求6所述的适用于高斯平滑的NEON优化方法,其特征在于,每次读取数据可以计算出20个点。
8.根据权利要求1至7中任一所述的适用于高斯平滑的NEON优化方法,其特征在于,所述方法包括以下步骤:进行寄存器拼接处理,并将结果存放至内存中。
9.根据权利要求8所述的适用于高斯平滑的NEON优化方法,其特征在于,所述将结果存放至内存中包括:基于neon寄存器,需将结果分多次存储。
10.根据权利要求1所述的适用于高斯平滑的NEON优化方法,其特征在于,所述方法包括以下步骤:将不需要参与计算的数据权值设成0,计算同行的下一个数据,只需将权值数据滚动一下即可。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海盈方微电子有限公司,未经上海盈方微电子有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210067301.0/1.html,转载请声明来源钻瓜专利网。





