[发明专利]一种基于工作序列的文档自动生成模型的构建方法有效
申请号: | 201710020020.9 | 申请日: | 2017-01-03 |
公开(公告)号: | CN106874244B | 公开(公告)日: | 2022-05-20 |
发明(设计)人: | 熊松泉 | 申请(专利权)人: | 宁波财经学院 |
主分类号: | G06F40/151 | 分类号: | G06F40/151;G06F40/117;G06F40/186 |
代理公司: | 北京睿智保诚专利代理事务所(普通合伙) 11732 | 代理人: | 周新楣 |
地址: | 315000 浙*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 工作 序列 文档 自动 生成 模型 构建 方法 | ||
本发明涉及文档自动生成领域,更具体的涉及一种基于工作序列的文档自动生成模型的构建方法,其针对文档生成过程中需要计算和利用上下文数据的问题,借鉴工作流程的思想,明确了计算步骤、计算序列和工作序列的概念,给出了变量内存栈和工作序列栈的定义,建立了一个基于工作序列的文档自动生成数学模型,实现了公式计算引擎算法、工作序列计算引擎算法、模板标签替换算法和目标文档转换算法,并在建筑结构加固设计计算书的自动生产中得到应用,经过测试,达到了不同加固方法的计算书自动生成要求,极大地简化了建筑加固设计的工作过程,显著提高了工作效率。
技术领域
本发明涉及文档自动生成技术领域,更具体的涉及一种基于工作序列的文档自动生成模型的构建方法。
背景技术
随着计算机的普及和信息化技术的发展,使用字处理软件撰写文档、完成工作报告,已经成为人们生活工作必不可少的事情。微软Office Word因满足办公需求、功能齐全、操作方便,已经成为流行的应用软件。在数据展示方面,使用Word可以制作图、问、表并茂的文档,具有一些报表工具不可替代的优点,包括多层次嵌套表格、斜线表格等;在专业文档方面,Word支持复杂的数学公式编辑和格式化呈现,支持对象嵌入扩展功能。
在企业生产环境中,因业务的连续性和重复性,工作过程中需要编制的检测报告、技术方案书、计算书等文档是重复发生的行为。同一类型的文档,在格式、结构和内容方面往往相似,在数据分析和结论评价方面常常不同。如果所有文档的编制工作全部由手工完成,无疑工作量巨大,而且因人为原因导致文档数据纰漏的风险极大。
值得庆幸的是Word不仅仅是一个文字编辑软件,还是一个可扩展编程开发环境,可以通过程序对Word进行二次开发自动生成文档,以满足用户的特定要求。目前,有关文档自动生成的研究取得了初步的进展,结合具体的行业,出现了一些成功的案例,但仍缺乏有效的理论支持。
早期文档自动生成的研究主要集中在Word二次开发的文档生成技术等方面(如报告生成、试卷生成、文档水印、自动排版、公式嵌入、数据填充等),开发技术使用VBA和OLE较为常见。这些研究结合具体的应用场景解决了一些实际问题,具有一定的现实意义。
在生成文档时使用模板是通用的做法:将一篇规范的通用文档中可被替换的部分采用插入批注的形式设置标签,通过标签查询与替换实现文档生成。葛芬等使用COM Add-In技术实现了_IDTExtensibility2派发接口,制作了模板定制工具,构建了模板数据库,实现了Word文档的自动生成。李自胜等采用XML技术,对文档模板进行了结构化设计,将文档内容归纳为既有文本、输入文本、单选文本和多选组合文本4种类型,分别采用编辑框、单选框和复选框控件界面,从而降低了文档处理的难度。
然而在企业生产环境中,待生成的目标文档并非简单地用数据替换模板中的标签,文档中嵌入的数据往往来自于数据库或依赖企业的某些业务系统。这些数据有些能直接从数据库查询得到;有些分散在业务系统中,需要按工作流程在网络中传递、汇总和审批;有些需要按自定义的规则经过进一步的计算和处理。因此,文档自动生成系统与工作流系统的结合成为一个研究方向。
曲明成等针对企业在编辑数据汇总文档时因手动计算、人工检验造成效率低下且容易出错等问题,结合工作流系统提出了一个文档自动生成的数学模型。数据经过工作流系统流转、审批,文档自动生成系统从中心数据库抽取数据嵌入模板自动生成文档。该模型清晰地描述了文档生成过程中的公式换算、数据抽取与映射及模板替换的问题,在电力制造企业的复杂计算文档自动化应用成功。但是对于如何识别计算步骤之间的依赖关系,如何通过复杂的计算序列控制文档生成过程,该模型没有提及。
姜鹏等在防汛文档智能生成模型构建中,借鉴和改造了传统的工作流概念,引入了有向图表示工作流模型,并将模型应用于防汛防旱简报生成,从而快速生成格式规范、数据准确、内容完善的防汛文档。作者在文中提出了使用有向图的节点表示工作步骤的概念,用节点之间的边表示数据流动关系。该文虽然给出了计算序列处理数据生成文档的轮廓,但重点却放在模板标签的查找替换算法和系统架构实现上。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于宁波财经学院,未经宁波财经学院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710020020.9/2.html,转载请声明来源钻瓜专利网。