[发明专利]输变电工程word文档表格内容中工程特性指标的智能提取方法在审
申请号: | 201410081331.2 | 申请日: | 2014-03-06 |
公开(公告)号: | CN103914440A | 公开(公告)日: | 2014-07-09 |
发明(设计)人: | 吴烈鑫;刘志明;陈锟;张章亮;李国勇;陈铭;王彦峰;侯凯;陈宝珍 | 申请(专利权)人: | 广东电网公司电网规划研究中心 |
主分类号: | G06F17/24 | 分类号: | G06F17/24;G06F17/30;G06Q50/06 |
代理公司: | 广州知友专利商标代理有限公司 44104 | 代理人: | 周克佑;高文龙 |
地址: | 510080 广*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 变电 工程 word 文档 表格 内容 特性 指标 智能 提取 方法 | ||
技术领域
本发明涉及输变电工程word文档中工程特性指标的提取方法,具体是指输变电工程word文档表格内容中工程特性指标的智能提取方法。
背景技术
在输变电工程评审工作中,评审专家需要反复的阅读评审报告才能从大量的文字和表格中提炼出评审指标内容,然后再综合给出评审意见。该过程中专家需要对文档内容进行反复的搜索,并记录相关指标内容,这些都需要专家手动完成,大大影响专家的工作效率和准确性。
工程特性指标信息主要存在工程设计报告中,不同的特性指标分布在不同的章节用正段文字描述说明或者采用表格方式说明。查看工程报告、模糊查找工程特性指标信息,效率低下。
发明内容
本发明的目的是提供输变电工程word文档表格内容中工程特性指标的智能提取方法,该提取方法能够从设计文件中,自动提取所需的输变电工程特性指标信息,提高专家在设计评审中的工作效率。
本发明的上述目的通过如下技术方案来实现的:
输变电工程word文档表格内容中工程特性指标的智能提取方法,其特征在于:该方法依次包括创建工程特性指标的指标库、工程特性指标的大纲级别提取和工程特性指标的表格内容提取,其中,创建的指标库作为工程特性指标提取的基础数据库,在对输变电工程特性指标进行提取时,首先进行大纲级别提取,然后进行表格内容提取;
所述的大纲级别提取依次包括如下步骤:
(1)初始化word文档,记录每一个表格所占用的段落数量;
(2)遍历word文档中的每一个段落,解析段落属性信息,记录每一个段落数;
(3)判断段落属性是否在表格中,若段落在表格中,则跳过该表格所占的段落数量,同时记录该表格在文档中出现的顺序号和所在的大纲标题,返回上述步骤(2);若段落不在表格中,则继续下述步骤(4);
(4)判断段落属性,如果段落属性值不是正文文本,直接取出段落大纲级别值并记录所在的级别;如果段落属性值是正文文本,则把大纲级别设置为正文文本,返回上述步骤(2);
(5)判断大纲级别为正文文本,使用正则表达式对段落内容进行解析,解析规则如下:
a.自定义大纲段落的特征是以数字和字母开头,大纲编号之间用“.”进行分割,并且若大纲后为数字开始内容则他们之间必定有空格进行区分;
b.过滤掉以数字开头,并非大纲的段落;
c.根据数字、字母使用正则表达式解析段落的大纲级别;
所述的表格内容提取依次包括如下步骤:
(1)通过创建的指标库获取工程特性指标所在章节标题以及表格提取需要的行列标题、表达式;
(2)匹配大纲级别提取的结果,获取对应大纲标题以及下面子节点大纲的表格和表格的顺号;
(3)根据表格编号直接定位文档中对应的表格;
(4)遍历每一个表格,根据配置的行列标题确定唯一单元表格,直接提取表格内的输变电工程特性指标,提取后得到所需的输变电工程特性指标。
与现有技术相比,本发明能够对输变电工程word文档表格内容中工程特性指标进行提取,提高专家在设计评审中的工作效率。
附图说明
下面结合附图和具体实施方式对本发明作进一步详细说明。
图1为本发明智能提取方法的整体流程框图;
图2为本发明智能提取方法中大纲级别提取的流程框图;
图3为本发明智能提取方法中表格内容提取的流程框图;
图4为本发明智能提取方法中创建的指标库的示意图;
图5为本发明智能提取方法的提取结果示意图。
具体实施方式
如图1至图5所示,本发明输变电工程word文档表格内容中工程特性指标的智能提取方法,该方法依次包括创建工程特性指标的指标库、工程特性指标的大纲级别提取和工程特性指标的表格内容提取,其中,创建的指标库作为工程特性指标提取的基础数据库,在对输变电工程特性指标进行提取时,首先进行大纲级别提取,然后进行表格内容提取。
首先对工程特性指标信息进行定义,然后把工程设计报告进行矢量化,提取报告中大纲标题,划分报告中文字描述和表格描述,采用多种方式对工程特性信息进行提取并综合展示,方便评审专家查看工程特性指标信息,提高评审专家的评审效率。智能提取的操作流程图如图1所示:
指标库的创建
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于广东电网公司电网规划研究中心,未经广东电网公司电网规划研究中心许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201410081331.2/2.html,转载请声明来源钻瓜专利网。
- 上一篇:白介素-6多肽抑制剂及其应用
- 下一篇:具有抗乳腺癌活性的寡肽及其应用