[发明专利]基于神经网络搜索的场景文字识别方法及装置在审
申请号: | 202110273296.4 | 申请日: | 2021-03-12 |
公开(公告)号: | CN113065413A | 公开(公告)日: | 2021-07-02 |
发明(设计)人: | 刘义江 | 申请(专利权)人: | 国网河北省电力有限公司;国网河北省电力有限公司雄安新区供电公司 |
主分类号: | G06K9/00 | 分类号: | G06K9/00;G06K9/32;G06N3/04 |
代理公司: | 石家庄新世纪专利商标事务所有限公司 13100 | 代理人: | 呼春辉 |
地址: | 050022 *** | 国省代码: | 河北;13 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 神经网络 搜索 场景 文字 识别 方法 装置 | ||
1.一种基于神经网络搜索的场景文字识别方法,其特征在于:包括如下步骤:S1特征提取,处理器获取图像,通过卷积神经网络获取图像相应的搜索空间;S2基于搜索空间搜索,处理器基于搜索空间搜索并获取场景文本。
2.根据权利要求1所述的基于神经网络搜索的场景文字识别方法,其特征在于:在步骤S1中,所述图像为设备采集的原始图像或者经过校正的图像,所述搜索空间为一条有效路径包括下采样路径搜索空间和操作方式搜索空间,搜索空间为大小统一的特征向量序列。
3.根据权利要求1所述的基于神经网络搜索的场景文字识别方法,其特征在于:在步骤S2中,搜索时,处理器将每一下采样位置相邻的上一位置的卷积块与该下采样位置相邻的下一位置的卷积块进行互换。
4.根据权利要求1所述的基于神经网络搜索的场景文字识别方法,其特征在于:在步骤S2中,处理器将无向图中的每一条边的操作权重在alpha矩阵中随机初始化,根据alpha矩阵生成子网络结构进行训练并得到反馈指标,通过双目标优化来联合优化alpha矩阵的参数和卷积神经网络的权重信息,在达到收敛效果后从学习到的混合概率信息中得到最终的卷积神经网络,基于该卷积神经网络重新进行完整的训练。
5.一种基于神经网络搜索的场景文字识别装置,其特征在于:包括特征提取模块和基于搜索空间搜索模块共两个程序模块,特征提取模块,用于处理器获取图像,通过卷积神经网络获取图像相应的搜索空间;基于搜索空间搜索模块,用于处理器基于搜索空间搜索并获取场景文本。
6.根据权利要求5所述的基于神经网络搜索的场景文字识别装置,其特征在于:特征提取模块中,所述图像为设备采集的原始图像或者经过校正的图像,所述搜索空间为一条有效路径包括下采样路径搜索空间和操作方式搜索空间,搜索空间为大小统一的特征向量序列。
7.根据权利要求5所述的基于神经网络搜索的场景文字识别装置,其特征在于:基于搜索空间搜索模块中,搜索时,处理器将每一下采样位置相邻的上一位置的卷积块与该下采样位置相邻的下一位置的卷积块进行互换。
8.根据权利要求5所述的基于神经网络搜索的场景文字识别装置,其特征在于:基于搜索空间搜索模块中,处理器将无向图中的每一条边的操作权重在alpha矩阵中随机初始化,根据alpha矩阵生成子网络结构进行训练并得到反馈指标,通过双目标优化来联合优化alpha矩阵的参数和卷积神经网络的权重信息,在达到收敛效果后从学习到的混合概率信息中得到最终的卷积神经网络,基于该卷积神经网络重新进行完整的训练。
9.一种基于神经网络搜索的场景文字识别装置,其特征在于:包括存储器、处理器以及存储在存储器中并可在处理器上运行的权利要求5~权利要求8中的程序模块,所述处理器执行程序模块时实现权利要求1~权利要求4中任意一项基于神经网络搜索的场景文字识别方法的步骤。
10.一种基于神经网络搜索的场景文字识别装置,其特征在于:为计算机可读存储介质,所述计算机可读存储介质存储有权利要求5~权利要求8中的程序模块,所述程序模块被处理器执行时实现权利要求1~权利要求4中任意一项基于神经网络搜索的场景文字识别方法的步骤。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于国网河北省电力有限公司;国网河北省电力有限公司雄安新区供电公司,未经国网河北省电力有限公司;国网河北省电力有限公司雄安新区供电公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110273296.4/1.html,转载请声明来源钻瓜专利网。