[发明专利]对图片中的文本内容进行排版的方法、装置、介质和设备有效
申请号: | 201910829016.6 | 申请日: | 2019-09-03 |
公开(公告)号: | CN110728129B | 公开(公告)日: | 2023-06-23 |
发明(设计)人: | 苗广艺;祝斌;黄灿 | 申请(专利权)人: | 北京字节跳动网络技术有限公司 |
主分类号: | G06F40/186 | 分类号: | G06F40/186 |
代理公司: | 北京国昊天诚知识产权代理有限公司 11315 | 代理人: | 张敏 |
地址: | 100041 北京市石景山区*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 图片 中的 文本 内容 进行 排版 方法 装置 介质 设备 | ||
1.一种对图片中的文本内容进行排版的方法,其特征在于,包括:
按照预设切割模型,对原始文本图片中的每行文本中的每一个字符进行切割,得到切割后的每一个字符;
针对每一个字符,计算字符的高度平均值和相邻字符间距离的平均值,并根据所述字符的高度平均值、所述相邻字符间距离的平均值和用户设置的配置参数计算出预设每一行文本的宽度,不同的所述配置参数用于对所述预设每一行文本的宽度进行调整;
根据所述预设每一行文本的宽度,对所述原始文本图片的每一行文本图像进行重新排版,得到目标文本图片。
2.根据权利要求1所述的方法,其特征在于,所述按照预设切割模型,对所述原始文本图片中的每行文本中的每一个字符进行切割,得到切割后的每一个字符包括:
按照预设版面分析模型,对所述原始文本图片中的每行文本进行切割,得到切割后的每行文本图像;
对每行文本图像进行字符切割,得到切割后的每一个字符。
3.根据权利要求2所述的方法,其特征在于,在所述对每行文本图像进行字符切割,得到切割后的每一个字符之前,所述方法还包括:
对每行文本图像中的每一行文本进行垂直方向的投影,得到对应的投影;根据对应的投影得到多个待切割的字符切割候选点,并从所述字符切割候选点中选取对每行文本图像进行字符切割的字符切割点。
4.根据权利要求2所述的方法,其特征在于,在所述按照预设切割模型,对所述原始文本图片中的每行文本中的每一个字符进行切割之前,所述方法还包括:
按照预设版面分析模型,对所述原始文本图片中的每行文本进行定位,定位出每行文本图像。
5.根据权利要求1所述的方法,其特征在于,
根据所述字符的高度平均值、所述相邻字符间距离的平均值和用户设置的配置参数计算出预设每一行文本的宽度的公式为:
Wb﹦(H+D)*K,其中,Wb为预设每一行文本的宽度、H为所述字符的高度平均值、D为所述相邻字符间距离的平均值、K为所述用户设置的配置参数。
6.根据权利要求5所述的方法,其特征在于,根据所述预设每一行文本的宽度,对所述原始文本图片的每一行文本图像进行重新排版包括:
选取当前待重新排版的所述原始文本图片的当前原始行文本图像,其中,所述目标文本图片的初始宽度为0,所述目标文本图片的初始位置为第一行;
比较Wb与LINEa+LINEb的宽度和的大小,得到相应的比较结果,其中,所述当前原始行以LINEa表示,所述原始文本图片的所述当前原始行对应的所述目标文本图片的排版调整行以LINEb表示,Wb为所述预设每一行文本的宽度;
根据比较结果对所述原始文本图片的当前原始行文本图像进行重新排版,得到相应的排版调整行;
针对所述原始文本图片,选取出新的一行文本图像,并根据所述预设每一行文本的宽度,对选取出的新的一行文本图像进行重新排版,得到相应的排版调整行,直至遍历所述原始文本图片的每一行文本图像,并对每一行文本图像均进行重新排版,得到相应的排版调整行。
7.根据权利要求6所述的方法,其特征在于,所述比较结果对所述原始文本图片的当前原始行文本图像进行重新排版,得到相应的排版调整行包括:
若LINEa+LINEb的宽度和大于Wb,则将LINEa切割为LINEa1和LINEa2,使得LINEa1+LINEb的宽度和小于或等于Wb,将LINEa1合并到LINEb的后面;将LINEb的行数+1,并变成所述目标文本图片的下一行,LINEb的宽度更新为0;将LINEa2赋给LINEa;或者,
若LINEa+LINEb的宽度和小于等于Wb,则直接将LINEa合并到LINEb的后面;更新LINEb的宽度;或者,
若LINEb的宽度等于Wb,则LINEb的行数+1,变成所述目标文本图片的下一行,LINEb的宽度更新为0;其中,所述当前原始行以LINEa表示,所述原始文本图片的所述当前原始行对应的所述目标文本图片的排版调整行以LINEb表示,Wb为所述预设每一行文本的宽度。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京字节跳动网络技术有限公司,未经北京字节跳动网络技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910829016.6/1.html,转载请声明来源钻瓜专利网。
- 内容再现系统、内容提供方法、内容再现装置、内容提供装置、内容再现程序和内容提供程序
- 内容记录系统、内容记录方法、内容记录设备和内容接收设备
- 内容服务系统、内容服务器、内容终端及内容服务方法
- 内容分发系统、内容分发装置、内容再生终端及内容分发方法
- 内容发布、内容获取的方法、内容发布装置及内容传播系统
- 内容提供装置、内容提供方法、内容再现装置、内容再现方法
- 内容传输设备、内容传输方法、内容再现设备、内容再现方法、程序及内容分发系统
- 内容发送设备、内容发送方法、内容再现设备、内容再现方法、程序及内容分发系统
- 内容再现装置、内容再现方法、内容再现程序及内容提供系统
- 内容记录装置、内容编辑装置、内容再生装置、内容记录方法、内容编辑方法、以及内容再生方法