[发明专利]一种电子文档的生成方法及设备在审
申请号: | 201910017061.1 | 申请日: | 2019-01-08 |
公开(公告)号: | CN109871521A | 公开(公告)日: | 2019-06-11 |
发明(设计)人: | 黄泽浩;宋欢儿 | 申请(专利权)人: | 平安科技(深圳)有限公司 |
主分类号: | G06F17/24 | 分类号: | G06F17/24;G06K9/34 |
代理公司: | 深圳中一专利商标事务所 44237 | 代理人: | 高星 |
地址: | 518000 广东省深圳市福田区福*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 电子文档 实体类型 文档项目 字符识别算法 目标实体 实体图像 文档模板 中心坐标 图像处理技术 获取目标 手动选取 输出字符 图像获取 有效区域 语义分析 字符区域 预设 匹配 | ||
1.一种电子文档的生成方法,其特征在于,包括:
获取目标实体的实体图像,并根据所述实体图像确定所述目标实体的实体类型,获取与所述实体类型匹配的文档模板;所述文档模板包含多个文档项目;
基于所述实体类型调整预设的字符识别算法,通过调整后的所述字符识别算法对实体图像进行处理,输出关于所述实体图像的字符信息;所述字符信息包括已识别字符以及该已识别字符的字符区域图像;
根据所述字符区域图像获取所述已识别字符的中心坐标,并通过所述中心坐标以及各个所述文档项目的有效区域,确定所述已识别字符所属的所述文档项目;
将所述已识别字符导入至所述文档模板内所属的所述文档项目,生成关于所述目标实体的电子文档。
2.根据权利要求1所述的生成方法,其特征在于,所述基于所述实体类型调整预设的字符识别算法,通过调整后的所述字符识别算法输出关于所述实体图像的字符信息,包括:
将所述实体图像导入五层池化网络进行池化降维操作,得到所述实体图像的池化特征矩阵;
获取与所述实体类型匹配的滑动窗口,基于所述滑动窗口在所述池化特征矩阵上进行滑动选取,得到多个窗口特征序列;
将所有所述窗口特征序列导入预设的循环神经网络,生成关于实体图像的字符识别窗口;
计算所述字符识别窗口在所述实体图像所覆盖的区域图像与所述字符识别窗口之间的卷积值,基于所述卷积值识别被所述字符识别窗口所覆盖的区域图像是否为字符区域图像;
识别所述字符区域图像包含的字符,生成所述字符信息。
3.根据权利要求1所述的生成方法,其特征在于,所述根据所述字符区域图像获取所述已识别字符的中心坐标,并通过所述中心坐标以及各个所述文档项目的有效区域,确定所述已识别字符所属的所述文档项目,包括:
获取所述字符区域图像的角坐标,并根据所述角坐标以及所述实体图像的图像尺寸,计算所述中心坐标;
计算所述中心坐标与所述有效区域的轮廓线上各个坐标点的相距距离,选取数值最小的所述相距距离作为所述字符区域图像与所述文档项目的特征距离;
选取所述特征距离最小的所述文档项目作为所述字符区域图像所述的文档项目。
4.根据权利要求1-3任一项所述的生成方法,其特征在于,在所述基于所述实体类型调整预设的字符识别算法,通过调整后的所述字符识别算法对实体图像进行处理,输出关于所述实体图像的字符信息之前,还包括:
根据所述实体图像中各个像素点的像素值,计算所述实体图像的平均像素值;
若所述实体图像内任一所述像素点与所述平均像素值的差值小于预设的背景阈值,则识别所述像素点为背景像素点;
将所述背景像素点覆盖的区域识别为背景区域图像,并将所述背景区域图像从所述实体图像中移除,得到所述字符区域图像。
5.根据权利要求1-3任一项所述的生成方法,其特征在于,所述获取目标实体的实体图像,并根据所述实体图像确定所述目标实体的实体类型,包括:
获取所述实体图像中预设区域的标示符;
基于所述标示符确定所述目标实体的实体类型。
6.一种电子文档的生成设备,其特征在于,包括:
实体图像获取单元,用于获取目标实体的实体图像,并根据所述实体图像确定所述目标实体的实体类型,获取与所述实体类型匹配的文档模板;所述文档模板包含多个文档项目;
字符信息输出单元,用于基于所述实体类型调整预设的字符识别算法,通过调整后的所述字符识别算法对实体图像进行处理,输出关于所述实体图像的字符信息;所述字符信息包括已识别字符以及该已识别字符的字符区域图像;
文档项目确定单元,用于根据所述字符区域图像获取所述已识别字符的中心坐标,并通过所述中心坐标以及各个所述文档项目的有效区域,确定所述已识别字符所属的所述文档项目;
字符信息导入单元,用于将所述已识别字符导入至所述文档模板内所属的所述文档项目,生成关于所述目标实体的电子文档。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于平安科技(深圳)有限公司,未经平安科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910017061.1/1.html,转载请声明来源钻瓜专利网。