[发明专利]对图片中的文本内容进行排版的方法、装置、介质和设备有效
申请号: | 201910829016.6 | 申请日: | 2019-09-03 |
公开(公告)号: | CN110728129B | 公开(公告)日: | 2023-06-23 |
发明(设计)人: | 苗广艺;祝斌;黄灿 | 申请(专利权)人: | 北京字节跳动网络技术有限公司 |
主分类号: | G06F40/186 | 分类号: | G06F40/186 |
代理公司: | 北京国昊天诚知识产权代理有限公司 11315 | 代理人: | 张敏 |
地址: | 100041 北京市石景山区*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 图片 中的 文本 内容 进行 排版 方法 装置 介质 设备 | ||
本发明提供了一种对图片中的文本内容进行排版的方法、装置、介质和电子设备,该排版方法按照预设切割模型,对原始文本图片中的每行文本中的每一个字符进行切割,得到切割后的每一个字符;针对每一个字符,计算字符的高度平均值和相邻字符间距离的平均值,并根据字符的高度平均值、相邻字符间距离的平均值和用户设置的配置参数计算出预设每一行文本的宽度;根据预设每一行文本的宽度,对原始文本图片的每一行文本图像进行重新排版,得到目标文本图片。本公开提供的排版方法,只需要人工批量配置一些参数即可,排版后的题目图片会达到版面统一并且更符合设备屏幕展示,达到和文本展示类似的美观效果;不仅节省了人力,还保证了美观度。
技术领域
本发明涉及计算机技术领域,具体而言,涉及对图片中的文本内容进行排版的方法、装置、介质和设备。
背景技术
教育培训市场规模一直在扩大,最近几年,在线教育也在快速发展。这些教育公司都需要建立自己的题库,将纸质的试卷和教辅书通过扫描成图片然后录入到系统中,是一个有效的建立题库的方法。将题目图片录入为文本,需要大量的人力工作,特别是公式的编辑录入部分,需要一些公式排版的专业知识,这样会导致题目录入的成本非常高。
为了节省题目录入的成本,一个简单方案是只将题目对应的图片切割出来,一道题目对应一张或几张图片,不再做后续的文本录入工作。这样截图格式的题目,在电子设备上使用的时候,会不太美观,主要原因是字体大小难以控制。如果题目本身一行字比较多,在一个屏幕宽度有限的设备上展示,需要将图片缩放到字体比较小,才能完整展示一道题的全部图片,这样会导致阅读起来很不舒适。另外,对于不同的教辅书和试卷,排版格式和字体都不一样,会导致不同切图题目的一行字数各不相同,进而导致在同一台设备上展示多个题目的时候,每个题目图片上的字体大小都不一样。
综上所述,题目录入成文本会导致录入成本非常高,题目切割为图片虽然成本低,会导致在电子终端屏幕上展示非常不美观。
因此,在长期的研发当中,发明人对如何对图片中的文本内容进行排版进行了大量的研究,提出了一种对图片中的文本内容进行排版的方法,以解决上述技术问题之一。
发明内容
本发明的目的在于提供一种对图片中的文本内容进行排版的方法、装置、介质和电子设备,能够解决上述提到的至少一个技术问题。具体方案如下:
根据本发明的具体实施方式,第一方面,本公开提供一种对图片中的文本内容进行排版的方法,包括:
按照预设切割模型,对原始文本图片中的每行文本中的每一个字符进行切割,得到切割后的每一个字符;
针对每一个字符,计算字符的高度平均值和相邻字符间距离的平均值,并根据所述字符的高度平均值、所述相邻字符间距离的平均值和用户设置的配置参数计算出预设每一行文本的宽度;
根据所述预设每一行文本的宽度,对所述原始文本图片的每一行文本图像进行重新排版,得到目标文本图片。
可选的,所述按照预设切割模型,对所述原始文本图片中的每行文本中的每一个字符进行切割,得到切割后的每一个字符包括:
按照所述预设版面分析模型,对所述原始文本图片中的每行文本进行切割,得到切割后的每行文本图像;
对每行文本图像进行字符切割,得到切割后的每一个字符。
可选的,在所述对每行文本图像进行字符切割,得到切割后的每一个字符之前,所述方法还包括:
对每行文本图像中的每一行文本进行垂直方向的投影,得到对应的投影,根据对应的投影得到多个待切割的字符切割候选点,并从所述字符切割候选点中选取对每行文本图像进行字符切割的字符切割点。
可选的,在所述按照预设切割模型,对所述原始文本图片中的每行文本中的每一个字符进行切割之前,所述方法还包括:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京字节跳动网络技术有限公司,未经北京字节跳动网络技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910829016.6/2.html,转载请声明来源钻瓜专利网。
- 内容再现系统、内容提供方法、内容再现装置、内容提供装置、内容再现程序和内容提供程序
- 内容记录系统、内容记录方法、内容记录设备和内容接收设备
- 内容服务系统、内容服务器、内容终端及内容服务方法
- 内容分发系统、内容分发装置、内容再生终端及内容分发方法
- 内容发布、内容获取的方法、内容发布装置及内容传播系统
- 内容提供装置、内容提供方法、内容再现装置、内容再现方法
- 内容传输设备、内容传输方法、内容再现设备、内容再现方法、程序及内容分发系统
- 内容发送设备、内容发送方法、内容再现设备、内容再现方法、程序及内容分发系统
- 内容再现装置、内容再现方法、内容再现程序及内容提供系统
- 内容记录装置、内容编辑装置、内容再生装置、内容记录方法、内容编辑方法、以及内容再生方法