[发明专利]文档发布方法、控制装置及可读存储介质在审
申请号: | 202211079552.7 | 申请日: | 2022-09-05 |
公开(公告)号: | CN115577198A | 公开(公告)日: | 2023-01-06 |
发明(设计)人: | 戈子根;郗亚静;朱静波;刘亚维;张强;白志兴;李春龙;高晓凯 | 申请(专利权)人: | 北京结慧科技有限公司 |
主分类号: | G06F16/957 | 分类号: | G06F16/957;G06F16/958;G06F40/166 |
代理公司: | 北京瀚仁知识产权代理事务所(普通合伙) 11482 | 代理人: | 陈敏 |
地址: | 100041 北京市石景山区*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 文档 发布 方法 控制 装置 可读 存储 介质 | ||
本发明涉及数据处理技术领域,具体提供一种文档发布方法、控制装置及可读存储介质,旨在解决如何实现在确保对html文档内容进行精确定位的同时,减少与数据后台的交互问题。为此目的,本发明可以将待处理源文档转换为文件流,并根据预设规则对文件流进行切割,获得目录表格,根据目录表格对待处理源文件的正文段落进行切割,获得每个目录层级对应的正文段落,将正文段落转换为html静态文件存储至web服务器中,以实现待处理源文档的发布。本发明能够基于目录层级对正文段落进行导航筛选,实现对文档内容的精准定位。同时,由于html静态文件均存储在web服务器中,使得用户在进行浏览时无需与后台进行交互就能够实现文档的快速加载。
技术领域
本发明涉及数据处理技术领域,具体提供一种文档发布方法、控制装置及可读存储介质。
背景技术
随着信息技术的快速发展,电子文档已经逐渐成为人们日常生活和工作中必不可少的一个部分了。而通过微信公众号来发布文档也成为信息传播过程中的一个非常重要的途径。
在一些场景下,需要将word格式的文件呈现在微信公众号上,例如第三方支付公式按照合规要求(银监会要求),需要将公司内部的合规文档(word格式)的内容推广至公司的公众号上。为此,一方面需要将内部word文档转换为html文档;另一方面由于公众号会有大量的阅读量,因而也需要实现文档数据的高速加载。这就需要解决在将word文档转换为html文档后进行文档发布后,如何实现在确保对文档内容进行精确定位的同时,减少与数据后台的交互问题。
相应地,本领域需要一种新的文档发布方案来解决上述问题。
发明内容
为了克服上述缺陷,提出了本发明,以提供解决或至少部分地解决如何实现在确保对html文档内容进行精确定位的同时,减少与数据后台的交互问题。
在第一方面,本发明提供一种文档发布方法,所述方法包括:
将待处理源文档转换为文件流;
根据预设规则,对所述文件流进行切割,获取所述待处理源文档的目录表格,其中,所述目录表格包括目录层级;
根据所述目录表格,对所述待处理源文档的正文段落进行切割,获得每个目录层级对应的正文段落;
将每个目录层级的正文段落转换为每个目录层级的html静态文件并存储至web服务器上,以实现所述待处理源文档的发布
在上述文档发布方法的一个技术方案中,所述目录表格包括目录文本;
所述根据预设规则,对待处理源文档对应的文件流进行切割,获取所述待处理源文档的目录表格,包括:
根据预设规则,对待处理源文件对应的文件流进行切割,获取所述待处理源文件的目录文本和目录层级;
将所述目录文本和目录层级以关系树的形式存储在数据库表中。
在上述文档发布方法的一个技术方案中,所述预设规则为正则表达式。
在上述文档发布方法的一个技术方案中,所述根据所述目录表格,对所述待处理源文档的正文段落进行切割,获得每个目录层级对应的正文段落,包括:
根据所述目录层级,以所述文件流的方式读取所述待处理源文档,按照目录层级对所述待处理源文档的文件流的正文段落进行切割,获得每个目录层级对应的正文段落;
将每个目录层级对应的正文段落,按照与所述目录层级之间的关联关系存储至数据库表中。
在上述文档发布方法的一个技术方案中,不同的所述目录层级对应的正文段落包含不同的html标签。
在上述文档发布方法的一个技术方案中,所述将每个目录层级的正文段落转换为每个目录层级的html静态文件并存储至web服务器上,包括:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京结慧科技有限公司,未经北京结慧科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202211079552.7/2.html,转载请声明来源钻瓜专利网。