[发明专利]文档图片展平方法、装置以及设备在审
申请号: | 202011287722.1 | 申请日: | 2020-11-17 |
公开(公告)号: | CN112509106A | 公开(公告)日: | 2021-03-16 |
发明(设计)人: | 陶炯 | 申请(专利权)人: | 科大讯飞股份有限公司 |
主分类号: | G06T15/04 | 分类号: | G06T15/04;G06T17/20;G06N3/08;G06N3/04 |
代理公司: | 北京维澳专利代理有限公司 11252 | 代理人: | 常小溪;王立民 |
地址: | 230088 安徽省*** | 国省代码: | 安徽;34 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 文档 图片展 平方 装置 以及 设备 | ||
1.一种文档图片展平方法,其特征在于,包括:
获取同一待处理文档的多张图片;
根据所述多张图片对所述待处理文档进行三维重建,获得三维结构信息;
根据所述三维结构信息以及预先训练的纹理映射模型,进行渲染贴图处理,得到展平后的文档图片。
2.根据权利要求1所述的文档图片展平方法,其特征在于,所述对所述待处理文档进行三维重建,获得三维结构信息包括:
根据所述多张图片以及预先训练的三维重建模型,获得所述待处理文档的三维网格及其顶点的位置信息和法向值。
3.根据权利要求2所述的文档图片展平方法,其特征在于,所述三维重建模型用于:
提取到所述多张图片的特征向量;
对特征向量进行下采样,得到特征信息;
对所述特征信息进行上采样,得到所述三维结构信息的特征向量。
4.根据权利要求1所述的文档图片展平方法,其特征在于,所述纹理映射模型包含若干稠密块层;
首个稠密块层接收三维结构信息的特征向量并进行处理;
后续稠密块层接收在先所有稠密块层的处理结果以及三维结构信息的特征向量;
经最后一个稠密块层处理后,输出经渲染贴图的展平后的文档图片。
5.根据权利要求1~4任一项所述的文档图片展平方法,其特征在于,所述获取同一待处理文档的多张图片包括:
基于多种拍摄位置所采集的所述待处理文档的多视角多形态的图片,且在同一角度采集若干张图片。
6.根据权利要求5所述的文档图片展平方法,其特征在于,所述方法还包括:
对所述待处理文档的同一角度的若干张图片进行预处理,得到该角度下的优化图片。
7.一种文档图片展平装置,其特征在于,包括:
图片获取模块,用于获取同一待处理文档的多张图片;
三维重建模块,用于根据所述多张图片对所述待处理文档进行三维重建,获得三维结构信息;
纹理映射模块,用于根据所述三维结构信息以及预先训练的纹理映射模型,进行渲染贴图处理,得到展平后的文档图片。
8.根据权利要求7所述的文档图片展平装置,其特征在于,所述三维重建模块包括:
特征提取单元,用于提取到所述多张图片的特征向量;
编码单元,用于对特征向量进行下采样,得到特征信息;
解码单元,用于对所述特征信息进行上采样,得到所述三维结构信息的特征向量。
9.根据权利要求7或8所述的文档图片展平装置,其特征在于,所述纹理映射模块包括:
首个稠密块单元,用于接收三维结构信息的特征向量并进行处理;
若干个中间稠密块单元,用于接收在先所有稠密块层的处理结果以及三维结构信息的特征向量;
最后一个稠密块单元,用于在处理后输出经渲染贴图的展平后的文档图片。
10.一种文档图片展平设备,其特征在于,包括:
一个或多个处理器、存储器以及一个或多个计算机程序,其中所述一个或多个计算机程序被存储在所述存储器中,所述一个或多个计算机程序包括指令,当所述指令被所述设备执行时,使得所述设备执行权利要求1~6任一项所述的文档图片展平方法。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于科大讯飞股份有限公司,未经科大讯飞股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011287722.1/1.html,转载请声明来源钻瓜专利网。