[发明专利]识别文档方向的方法、系统和神经网络有效

专利信息
申请号: 201710060219.4 申请日: 2017-01-24
公开(公告)号: CN108345827B 公开(公告)日: 2021-11-30
发明(设计)人: 王若辰;范伟;孙俊 申请(专利权)人: 富士通株式会社
主分类号: G06K9/00 分类号: G06K9/00;G06K9/32;G06K9/62
代理公司: 北京集佳知识产权代理有限公司 11227 代理人: 康建峰;韩雪梅
地址: 日本神*** 国省代码: 暂无信息
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 识别 文档 方向 方法 系统 神经网络
【说明书】:

发明公开了一种识别文档方向的方法、系统和神经网络。该方法包括:提取文档中的文本行;计算文本行为正向的第一正向结果和为反向的第一反向结果;计算旋转180度后的文本行为正向的第二正向结果和为反向的第二反向结果;以及根据第一正向结果和第一反向结果以及第二正向结果和第二反向结果确定文档的方向。

技术领域

本发明涉及一种用于识别文档的方向的方法、系统和神经网络。

背景技术

随着深度学习技术的兴起,卷积神经网络被越来越多地运用在图像检测、分类等任务中,其中也包括图像方向判别。卷积神经网络是一个多层的神经网络,每层由多个二维平面组成,而每个平面由多个独立神经元组成。目前有许多卷积神经网络架构的变体,但它们的基本结构非常相似,卷积神经网络的基本结构包括三个层,即卷积层、池化层(也称下采样层)和全连接层。用于模式分类的卷积神经网络通常在最后层使用分类器,如softmax。图1示出了现有技术中的典型卷积神经网络的结构。如图1所示,该典型卷积神经网络包括输入层、卷积层、池化层、全连接层和分类器。

输入层为待处理的对象。

卷积层旨在学习输入的特征表示。如图1所示,卷积层由几个特征图(featuremaps)组成。一个特征图的每个神经元与它前一层的邻近神经元相连,这样的一个邻近区域叫做该神经元在前一层的局部感知野。为了计算一个新的特征图,输入特征图首先与一个学习好的卷积核(也被称为滤波器、特征检测器)做卷积,然后将结果传递给一个非线性激活函数。通过应用不同的卷积核得到新的特征图。注意到,生成一个特征图的核是相同的(也就是权值共享)。这样的一个权值共享模式有几个优点,如可以减少模型的复杂度,使网络更易训练等。激活函数描述卷积神经网络的非线性度,对多层网络检测非线性特征十分理想。典型的激活函数有sigmoid、tanh和ReLU。

池化层(也称下采样层)旨在通过降低特征图的分辨率实现空间不变性。它通常位于两个卷积层之间。每个池化层的特征图和它相应的前一卷积层的特征图相连,因此它们的特征图数量相同。典型的池化操作是平均池化和最大池化。通过叠加几个卷积和池化层,我们可以提取更抽象的特征表示。

若干个卷积和池化层之后,通常有一个或多个全连接层。它们将前一层所有的神经元与自身的每个神经元相连接,在全连接层不保存空间信息。

全连接层后面接一个分类器,分类器通常由一个多层感知机构成。

以上介绍的典型的卷积神经网络因避免了对图像的复杂前期预处理,可以直接输入原始图像,因而得到了广泛的应用。然而,在图像方向判别中,直接使用普通的卷积神经网络,很难取得比较好的识别效果。其中一个重要的原因是,被识别的样本中含有大量自身对称,以致无法识别方向的图片。

发明内容

在下文中给出了关于本发明的简要概述,以便提供关于本发明的某些方面的基本理解。应当理解,该概述并不是关于本发明的穷举性概述,它并非意图确定本发明的关键或重要部分,也不是意图限定本发明的范围。其目的仅仅是以简化的形式给出某些概念,以此作为后文的具体实施方式部分的铺垫。

鉴于以上提出的问题,本发明提出了一种用于识别文档的方向的方法、系统和神经网络。这种识别文档方向的方法、系统和神经网络可以有效地去除自身对称样本在方向判别任务中带来的干扰,进而提升模型的整体精度。

根据本发明的一个方面,提供了一种用于识别文档的方向的方法,包括:提取文档中的文本行;计算所述文本行为正向的第一正向结果和为反向的第一反向结果;计算旋转180度后的所述文本行为正向的第二正向结果和为反向的第二反向结果;以及根据所述第一正向结果和所述第一反向结果以及所述第二正向结果和所述第二反向结果确定文档的方向。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于富士通株式会社,未经富士通株式会社许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201710060219.4/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top