[发明专利]电子书的排版处理方法、电子设备及存储介质在审
申请号: | 202210102461.4 | 申请日: | 2022-01-27 |
公开(公告)号: | CN114492303A | 公开(公告)日: | 2022-05-13 |
发明(设计)人: | 李铭瀚;张恒 | 申请(专利权)人: | 掌阅科技股份有限公司 |
主分类号: | G06F40/109 | 分类号: | G06F40/109;G06F16/903 |
代理公司: | 北京开阳星知识产权代理有限公司 11710 | 代理人: | 吴崇 |
地址: | 100022 北京市朝阳区东三环中路3*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 电子书 排版 处理 方法 电子设备 存储 介质 | ||
本公开涉及一种电子书的排版处理方法、电子设备及存储介质。其中,电子书的排版处理方法包括:对电子书的版式文档中包含的原始文本进行解析,得到原始文本包含的至少一个字符串,针对至少一个字符串中的目标字符串,将目标字符串与预设词汇表进行匹配,在确定目标字符串存在与预设词汇表中的单词匹配成功的第一字符组合时,根据第一字符组合,将目标字符串拆分为多个子字符串,在每两个相邻的字符串以及每两个相邻的子字符串之间分别添加空格,得到电子书的流式文档。可见,根据本公开实施例,可以将原始文本包含的多个字符拆分为多个单词,便于用户阅读,提高用户的阅读体验。
技术领域
本公开涉及计算机技术领域,尤其涉及一种电子书的排版处理方法、电子设备及存储介质。
背景技术
版式文档格式是版面呈现效果固定的电子文档格式,版式文档的呈现与设备无关,因此,版式文档主要应用于成文后文件的发布、传播和存档。当想要灵活编辑版式文档中的内容时,需要将版式文档转换为流式文档。
目前,对版式文档进行解析处理后可转换为流式文档,但是,流式文档中由于缺失空格,导致对用户的阅读造成不变,尤其是当版式文档中包括英文时,用户难以区分出各个单词,导致阅读障碍。因此,亟需一种能够添加空格的方法。
发明内容
为了解决上述技术问题或者至少部分地解决上述技术问题,本公开提供了一种电子书的排版处理方法、电子设备及存储介质。
第一方面,本公开提供了一种电子书的排版处理方法,包括:
对电子书的版式文档中包含的原始文本进行解析,得到原始文本包含的至少一个字符串;
针对至少一个字符串中的目标字符串,将目标字符串与预设词汇表进行匹配;
在确定目标字符串存在与预设词汇表中的单词匹配成功的第一字符组合时,根据第一字符组合,将目标字符串拆分为多个子字符串;
在每两个相邻的字符串以及每两个相邻的子字符串之间分别添加空格,得到电子书的流式文档。
第二方面,本公开提供了一种电子设备,包括处理器和存储器,存储器用于存储可执行指令,可执行指令使处理器执行以下操作:
对电子书的版式文档中包含的原始文本进行解析,得到原始文本包含的至少一个字符串;
针对至少一个字符串中的目标字符串,将目标字符串与预设词汇表进行匹配;
在确定目标字符串存在与预设词汇表中的单词匹配成功的第一字符组合时,根据第一字符组合,将目标字符串拆分为多个子字符串;
在每两个相邻的字符串以及每两个相邻的子字符串之间分别添加空格,得到电子书的流式文档。
第三方面,本公开提供了一种计算机可读存储介质,该存储介质存储有计算机程序,当计算机程序被处理器执行时,使得处理器实现第一方面的电子书的排版处理方法。
本公开实施例提供的技术方案与现有技术相比具有如下优点:
本公开实施例的电子书的排版处理方法、电子设备及存储介质,能够对电子书的版式文档中包含的原始文本进行解析,得到原始文本包含的至少一个字符串,针对至少一个字符串中的目标字符串,将目标字符串与预设词汇表进行匹配,在确定目标字符串存在与预设词汇表中的单词匹配成功的第一字符组合时,根据第一字符组合,将目标字符串拆分为多个子字符串,在每两个相邻的字符串以及每两个相邻的子字符串之间分别添加空格,得到电子书的流式文档。可见,根据本公开实施例,可以将至少一个字符串作为目标字符串,并且基于目标字符串与预设词汇表的匹配结果将目标字符串拆分为多个子字符串,并且在每两个相邻的字符串以及每两个相邻的子字符串之间分别添加空格,从而将原始文本包含的多个字符拆分为多个单词,便于用户阅读,提高用户的阅读体验。
附图说明
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于掌阅科技股份有限公司,未经掌阅科技股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210102461.4/2.html,转载请声明来源钻瓜专利网。