[发明专利]文档图片展平方法、装置以及设备在审
申请号: | 202011287722.1 | 申请日: | 2020-11-17 |
公开(公告)号: | CN112509106A | 公开(公告)日: | 2021-03-16 |
发明(设计)人: | 陶炯 | 申请(专利权)人: | 科大讯飞股份有限公司 |
主分类号: | G06T15/04 | 分类号: | G06T15/04;G06T17/20;G06N3/08;G06N3/04 |
代理公司: | 北京维澳专利代理有限公司 11252 | 代理人: | 常小溪;王立民 |
地址: | 230088 安徽省*** | 国省代码: | 安徽;34 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 文档 图片展 平方 装置 以及 设备 | ||
本发明公开了一种文档图片展平方法、装置以及设备,本发明的构思在于结合三维重建、深度学习以及相关优化知识,通过多张图片的联合输入进行文档图片的三维重构,并从中获取三维结构信息,接着再由基于深度学习框架的网络模型根据三维结构信息进行展平校正处理。本发明提出的解决思路简便、高效、且可以保证处理结果的精度,无需花费较大成本构建拍摄平台也无需进行复杂的求解运算,在满足实时处理要求的同时,能够显著降低信息的丢失率。
技术领域
本发明涉及图像处理领域,尤其涉及一种文档图片展平方法、装置以及设备。
背景技术
在日常工作中经常会使用到文档进行信息的传递和交流,但是由于传统文档载体不利于传输和共享等缺点,因此电子文档成为了一种非常快捷和方便的文档形式,通常可以使用诸如手机、相机等拍摄设备对文档内容进行采集,然后进行后续信息的提取和共享。
但是在拍摄的过程中很容易造成信息丢失,比如文档实物由于材质和形态等原因,会出现弯曲或折痕等变形情况,这就使得拍摄的文档图片中展示的内容有所缺损甚至丢失。
经发明人实践发现,对于此类不规则或变形的文档图片进行校正的操作处理,一般都较为复杂且处理效率不高,或者是需要搭建专业设备平台,导致难以合理控制成本,因而均无法在最大保留原始信息的目标前提下,高效、便捷、精准地完成展平处理任务。
发明内容
鉴于上述,本发明旨在提供一种文档图片展平方法、装置以及设备,以及相应地提供了一种计算机可读存储介质和计算机程序产品,用以在对文档图片进行展平处理时确保信息损失较小,并兼顾高效、准确的展平效果以及相对较低的处理成本。
本发明采用的技术方案如下:
第一方面,本发明提供了一种文档图片展平方法,其中,包括:
获取同一待处理文档的多张图片;
根据所述多张图片对所述待处理文档进行三维重建,获得三维结构信息;
根据所述三维结构信息以及预先训练的纹理映射模型,进行渲染贴图处理,得到展平后的文档图片。
在其中至少一种可能的实现方式中,所述对所述待处理文档进行三维重建,获得三维结构信息包括:
根据所述多张图片以及预先训练的三维重建模型,获得所述待处理文档的三维网格及其顶点的位置信息和法向值。
在其中至少一种可能的实现方式中,所述三维重建模型用于:
提取到所述多张图片的特征向量;
对特征向量进行下采样,得到特征信息;
对所述特征信息进行上采样,得到所述三维结构信息的特征向量。
在其中至少一种可能的实现方式中,所述纹理映射模型包含若干稠密块层;
首个稠密块层接收三维结构信息的特征向量并进行处理;
后续稠密块层接收在先所有稠密块层的处理结果以及三维结构信息的特征向量;
经最后一个稠密块层处理后,输出经渲染贴图的展平后的文档图片。
在其中至少一种可能的实现方式中,所述获取同一待处理文档的多张图片包括:
基于多种拍摄位置所采集的所述待处理文档的多视角多形态的图片,且在同一角度采集若干张图片。
在其中至少一种可能的实现方式中,所述方法还包括:
对所述待处理文档的同一角度的若干张图片进行预处理,得到该角度下的优化图片。
第二方面,本发明提供了一种文档图片展平装置,其中,包括:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于科大讯飞股份有限公司,未经科大讯飞股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011287722.1/2.html,转载请声明来源钻瓜专利网。