[发明专利]一种PDF文件的生成方法、装置、设备及可读存储介质在审
申请号: | 202210465672.4 | 申请日: | 2022-04-29 |
公开(公告)号: | CN114817133A | 公开(公告)日: | 2022-07-29 |
发明(设计)人: | 崔守佳;朱道昌 | 申请(专利权)人: | 济南浪潮数据技术有限公司 |
主分类号: | G06F16/11 | 分类号: | G06F16/11;G06F16/16;G06F40/109;G06F40/134 |
代理公司: | 北京集佳知识产权代理有限公司 11227 | 代理人: | 张倩 |
地址: | 250101 山东省济南市自由贸易试验区*** | 国省代码: | 山东;37 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 pdf 文件 生成 方法 装置 设备 可读 存储 介质 | ||
本申请适用于文件处理技术领域,公开了一种PDF文件的生成方法,在接收源文件并解析得到文件内容后,根据文件内容将源文件转换为HTML文件,并根据源文件的文件类型对应的语法中内部超链接的命名规则,在文件内容中搜索第一内部超链接;若搜索到第一内部超链接,则根据第一内部超链接的链接文本和链接目标,在HTML文件中建立链接文本和链接目标之间的第二内部超链接,得到处理后的HTML文件,根据处理后的HTML文件生成PDF文件,从而保证了生成的PDF文件中保留源文件中的内部超链接,提升了PDF文件的可用性,优化了用户体验。本申请还公开了一种PDF文件的生成装置、设备及可读存储介质,具有上述有益效果。
技术领域
本申请涉及文件处理技术领域,特别是涉及一种PDF文件的生成方法、装置、设备及可读存储介质。
背景技术
PDF(Portable Document Format,可携带文档格式)是一种电子文件格式。现今越来越多的电子图书、产品说明、公司文告、网络资料、电子邮件在开始使用PDF格式文件。
目前根据其他类型的源文件生成PDF文件的工具,无法完全还原源文件中包含的信息,如源文件中包含的内部超链接,将在生成的PDF文件中失效,给用户带来了不良体验。
在生成PDF文件之后仍保留源文件中的内部超链接,优化用户体验,是本领域技术人员需要解决的技术问题。
发明内容
本申请的目的是提供一种PDF文件的生成方法、装置、设备及可读存储介质,实现在生成PDF文件后保留源文件中的内部超链接,优化用户体验。
为解决上述技术问题,本申请提供一种PDF文件的生成方法,包括:
接收源文件;
解析得到所述源文件的文件内容;
根据所述文件内容,将所述源文件转换为HTML文件;
根据所述源文件的文件类型对应的语法中内部超链接的命名规则,在所述文件内容中搜索第一内部超链接;
若搜索到所述第一内部超链接,则根据所述第一内部超链接的链接文本和所述第一内部超链接的链接目标,在所述HTML文件中建立所述链接文本和所述链接目标之间的第二内部超链接,得到处理后的HTML文件;
根据所述处理后的HTML文件生成PDF文件。
可选的,若所述第一内部超链接为目录导航链接,在所述得到处理后的HTML文件之前,还包括:
确定在所述HTML文件中所述链接目标的垂直坐标;
根据所述HTML文件的第一排版设置参数和所述链接目标的垂直坐标,确定在所述HTML文件中所述链接目标的页码信息;
根据所述链接目标的页码信息更新所述链接文本处的页码信息。
可选的,当接收到对所述源文件的目录创建命令时,在所述得到处理后的HTML文件之前,还包括:
根据所述源文件的文件类型对应的语法中标题的命名规则,在所述文件内容中识别得到标题信息;
根据各所述标题信息的层级关系生成目录文本,并将所述目录文本插入所述HTML文件中所述目录创建命令所要求的位置;
为所述目录文本中的各标题链接文本创建与对应的所述标题信息之间的所述第二内部超链接,得到所述处理后的HTML文件。
可选的,在生成所述目录文本之后,在所述得到处理后的HTML文件之前,还包括:
确定在所述HTML文件中所述标题信息的垂直坐标;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于济南浪潮数据技术有限公司,未经济南浪潮数据技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210465672.4/2.html,转载请声明来源钻瓜专利网。