[发明专利]一种PDF文件的生成方法、装置、设备及可读存储介质在审
申请号: | 202210465672.4 | 申请日: | 2022-04-29 |
公开(公告)号: | CN114817133A | 公开(公告)日: | 2022-07-29 |
发明(设计)人: | 崔守佳;朱道昌 | 申请(专利权)人: | 济南浪潮数据技术有限公司 |
主分类号: | G06F16/11 | 分类号: | G06F16/11;G06F16/16;G06F40/109;G06F40/134 |
代理公司: | 北京集佳知识产权代理有限公司 11227 | 代理人: | 张倩 |
地址: | 250101 山东省济南市自由贸易试验区*** | 国省代码: | 山东;37 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 pdf 文件 生成 方法 装置 设备 可读 存储 介质 | ||
1.一种PDF文件的生成方法,其特征在于,包括:
接收源文件;
解析得到所述源文件的文件内容;
根据所述文件内容,将所述源文件转换为HTML文件;
根据所述源文件的文件类型对应的语法中内部超链接的命名规则,在所述文件内容中搜索第一内部超链接;
若搜索到所述第一内部超链接,则根据所述第一内部超链接的链接文本和所述第一内部超链接的链接目标,在所述HTML文件中建立所述链接文本和所述链接目标之间的第二内部超链接,得到处理后的HTML文件;
根据所述处理后的HTML文件生成PDF文件。
2.根据权利要求1所述的生成方法,其特征在于,若所述第一内部超链接为目录导航链接,在所述得到处理后的HTML文件之前,还包括:
确定在所述HTML文件中所述链接目标的垂直坐标;
根据所述HTML文件的第一排版设置参数和所述链接目标的垂直坐标,确定在所述HTML文件中所述链接目标的页码信息;
根据所述链接目标的页码信息更新所述链接文本处的页码信息。
3.根据权利要求1所述的生成方法,其特征在于,当接收到对所述源文件的目录创建命令时,在所述得到处理后的HTML文件之前,还包括:
根据所述源文件的文件类型对应的语法中标题的命名规则,在所述文件内容中识别得到标题信息;
根据各所述标题信息的层级关系生成目录文本,并将所述目录文本插入所述HTML文件中所述目录创建命令所要求的位置;
为所述目录文本中的各标题链接文本创建与对应的所述标题信息之间的所述第二内部超链接,得到所述处理后的HTML文件。
4.根据权利要求3所述的生成方法,其特征在于,在生成所述目录文本之后,在所述得到处理后的HTML文件之前,还包括:
确定在所述HTML文件中所述标题信息的垂直坐标;
根据所述HTML文件的第二排版设置参数和所述标题信息的垂直坐标,确定在所述HTML文件中所述标题信息的页码信息;
根据所述标题信息的页码信息更新所述标题链接文本处的页码信息。
5.根据权利要求1所述的生成方法,其特征在于,所述在所述HTML文件中建立所述链接文本和所述链接目标之间的第二内部超链接,具体为:
在所述HTML文件中所述链接文本处创建以所述链接目标为锚点的所述第二内部超链接。
6.根据权利要求1所述的生成方法,其特征在于,还包括:
接收对所述PDF文件的第三排版设置参数;
根据所述第三排版设置参数生成CSS脚本;
所述将所述源文件转换为HTML文件,具体包括:
若所述第三排版设置参数包括文本排版参数,则调用与所述文本排版参数对应的所述CSS脚本对根据所述源文件转换得到的初始HTML文件进行文本排版,得到所述HTML文件;
若所述第三排版设置参数不包括所述文本排版参数,则根据默认文本排版参数对所述初始HTML文件进行文本排版,得到所述HTML文件;
所述根据所述处理后的HTML文件生成PDF文件,具体包括:
若所述第三排版设置参数包括页面布局参数,则调用与所述页面布局参数对应的所述CSS脚本对根据所述处理后的HTML文件生成的初始PDF文件进行页面布局,得到所述PDF文件;
若所述第三排版设置参数不包括所述页面布局参数,则根据默认页面布局参数对所述初始PDF文件进行页面布局,得到所述PDF文件。
7.根据权利要求1所述的生成方法,其特征在于,所述源文件的文件类型具体为Markdown文件、RST文件或Word文件。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于济南浪潮数据技术有限公司,未经济南浪潮数据技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210465672.4/1.html,转载请声明来源钻瓜专利网。