[发明专利]对图片中的文本内容进行排版的方法、装置、介质和设备有效

专利信息
申请号: 201910829016.6 申请日: 2019-09-03
公开(公告)号: CN110728129B 公开(公告)日: 2023-06-23
发明(设计)人: 苗广艺;祝斌;黄灿 申请(专利权)人: 北京字节跳动网络技术有限公司
主分类号: G06F40/186 分类号: G06F40/186
代理公司: 北京国昊天诚知识产权代理有限公司 11315 代理人: 张敏
地址: 100041 北京市石景山区*** 国省代码: 北京;11
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 图片 中的 文本 内容 进行 排版 方法 装置 介质 设备
【权利要求书】:

1.一种对图片中的文本内容进行排版的方法,其特征在于,包括:

按照预设切割模型,对原始文本图片中的每行文本中的每一个字符进行切割,得到切割后的每一个字符;

针对每一个字符,计算字符的高度平均值和相邻字符间距离的平均值,并根据所述字符的高度平均值、所述相邻字符间距离的平均值和用户设置的配置参数计算出预设每一行文本的宽度,不同的所述配置参数用于对所述预设每一行文本的宽度进行调整;

根据所述预设每一行文本的宽度,对所述原始文本图片的每一行文本图像进行重新排版,得到目标文本图片。

2.根据权利要求1所述的方法,其特征在于,所述按照预设切割模型,对所述原始文本图片中的每行文本中的每一个字符进行切割,得到切割后的每一个字符包括:

按照预设版面分析模型,对所述原始文本图片中的每行文本进行切割,得到切割后的每行文本图像;

对每行文本图像进行字符切割,得到切割后的每一个字符。

3.根据权利要求2所述的方法,其特征在于,在所述对每行文本图像进行字符切割,得到切割后的每一个字符之前,所述方法还包括:

对每行文本图像中的每一行文本进行垂直方向的投影,得到对应的投影;根据对应的投影得到多个待切割的字符切割候选点,并从所述字符切割候选点中选取对每行文本图像进行字符切割的字符切割点。

4.根据权利要求2所述的方法,其特征在于,在所述按照预设切割模型,对所述原始文本图片中的每行文本中的每一个字符进行切割之前,所述方法还包括:

按照预设版面分析模型,对所述原始文本图片中的每行文本进行定位,定位出每行文本图像。

5.根据权利要求1所述的方法,其特征在于,

根据所述字符的高度平均值、所述相邻字符间距离的平均值和用户设置的配置参数计算出预设每一行文本的宽度的公式为:

Wb﹦(H+D)*K,其中,Wb为预设每一行文本的宽度、H为所述字符的高度平均值、D为所述相邻字符间距离的平均值、K为所述用户设置的配置参数。

6.根据权利要求5所述的方法,其特征在于,根据所述预设每一行文本的宽度,对所述原始文本图片的每一行文本图像进行重新排版包括:

选取当前待重新排版的所述原始文本图片的当前原始行文本图像,其中,所述目标文本图片的初始宽度为0,所述目标文本图片的初始位置为第一行;

比较Wb与LINEa+LINEb的宽度和的大小,得到相应的比较结果,其中,所述当前原始行以LINEa表示,所述原始文本图片的所述当前原始行对应的所述目标文本图片的排版调整行以LINEb表示,Wb为所述预设每一行文本的宽度;

根据比较结果对所述原始文本图片的当前原始行文本图像进行重新排版,得到相应的排版调整行;

针对所述原始文本图片,选取出新的一行文本图像,并根据所述预设每一行文本的宽度,对选取出的新的一行文本图像进行重新排版,得到相应的排版调整行,直至遍历所述原始文本图片的每一行文本图像,并对每一行文本图像均进行重新排版,得到相应的排版调整行。

7.根据权利要求6所述的方法,其特征在于,所述比较结果对所述原始文本图片的当前原始行文本图像进行重新排版,得到相应的排版调整行包括:

若LINEa+LINEb的宽度和大于Wb,则将LINEa切割为LINEa1和LINEa2,使得LINEa1+LINEb的宽度和小于或等于Wb,将LINEa1合并到LINEb的后面;将LINEb的行数+1,并变成所述目标文本图片的下一行,LINEb的宽度更新为0;将LINEa2赋给LINEa;或者,

若LINEa+LINEb的宽度和小于等于Wb,则直接将LINEa合并到LINEb的后面;更新LINEb的宽度;或者,

若LINEb的宽度等于Wb,则LINEb的行数+1,变成所述目标文本图片的下一行,LINEb的宽度更新为0;其中,所述当前原始行以LINEa表示,所述原始文本图片的所述当前原始行对应的所述目标文本图片的排版调整行以LINEb表示,Wb为所述预设每一行文本的宽度。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京字节跳动网络技术有限公司,未经北京字节跳动网络技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201910829016.6/1.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top