[发明专利]一种基于尺度自适应及方向注意力网络的场景文字识别方法在审
申请号: | 202011424315.0 | 申请日: | 2020-12-08 |
公开(公告)号: | CN112257716A | 公开(公告)日: | 2021-01-22 |
发明(设计)人: | 鲍虎军;李特;操晓春;代朋纹;张华 | 申请(专利权)人: | 之江实验室 |
主分类号: | G06K9/32 | 分类号: | G06K9/32;G06N3/04;G06N3/08 |
代理公司: | 杭州求是专利事务所有限公司 33200 | 代理人: | 邱启旺 |
地址: | 311121 浙江省杭州市余*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明涉及一种基于尺度自适应及方向注意力网络的场景文字识别方法,将输入图片映射到极坐标空间中得到极坐标图像,并利用卷积网络提取极坐标图像的特征J;利用深度卷积网络将图片在极坐标空间中的特征表达转换成高阶的语义特征F;对转换得到的高阶语义特征,利用字符感受野注意力机制对每个字符编码更相关区域的特征,获取鲁棒的特征表达并离散成为特征序列Q;利用双向长短记忆网络捕捉特征序列Q之间的上下文关系,获取特征序列H;将特征序列H输入至解码网络进行解析,生成语义顺序规则的文字字符串。本发明能有效识别任意语义方向的场景文字;对于不同尺度的字符能编码更加有效的特征表达,显著提升识别性能。 | ||
搜索关键词: | 一种 基于 尺度 自适应 方向 注意力 网络 场景 文字 识别 方法 | ||
【主权项】:
暂无信息
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于之江实验室,未经之江实验室许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/202011424315.0/,转载请声明来源钻瓜专利网。