[发明专利]一种智能解析excel格式国际机票运价单的方法在审
申请号: | 201410336305.X | 申请日: | 2014-07-16 |
公开(公告)号: | CN104133861A | 公开(公告)日: | 2014-11-05 |
发明(设计)人: | 黄翰;叶树锦;卢尔昂;郝志峰 | 申请(专利权)人: | 华南理工大学 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 广州粤高专利商标代理有限公司 44102 | 代理人: | 何淑珍 |
地址: | 511400 广东省广州市*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 智能 解析 excel 格式 国际 机票 运价 方法 | ||
1.一种智能解析excel格式国际机票运价单的方法,其特征在于,包括以下步骤:
(1)对大量已有价单进行分析:根据所要提取的运价信息,初步分析不同价单之间的异同,其中所要提取的运价信息包括出发地、目的地、中转站、行程类型、最大停留时间、最小停留时间以及成人运价航程属性;
(2)将价单按不同格式进行分类,分类方法为:根据步骤(1)的初步分析,将所需信息存储方式相近或相同的具有较大共性的价单归类;
(3)对已分类的价单分别进行解析,根据航程属性所在的大概位置,锁定检索范围;
(4)在锁定的检索范围内,分析归纳所需提取的运价信息的检索提取规则,具体包含以下步骤:
(a)找出所需提取的信息附近是否有共同的固定的关键字或关键词组,将其作为检索标志;
(b)确定所需提取信息与检索标志之间的位置关系;
(5)在锁定的检索范围内,进行逐格扫描,查找表格的表头标志,并记录表头的航程属性以及所在行数;
(6)在表头位置下一行开始进行逐格扫描,找出所有包含价格信息的单元格,每一个价格信息拆分成一条航程;
(7)根据分析归纳的检索提取规则,找出步骤(6)中所有价格对应的航程属性,并以统一的格式保存;
(8)重复步骤(5)到(7),直到找不到下一个表头标志,则对所有表格拆分完毕。
2.根据权利要求1所述智能解析excel格式国际机票运价单的方法,其特征在于:所述步骤(5)中,表头含有以下航程属性:
(a)路线,其中包含出发地与中转站三字码,并以“-”分隔;
(b)航程类型,包括单程和往返程两类;
(c)订座舱位,舱位信息由舱位码表示,为单个大写英文字母;
(d)有效期。
3.根据权利要求1所述智能解析excel格式国际机票运价单的方法,其特征在于:步骤(6)所述价格信息的查找方法为:从表头位置下一行进行逐格扫描,遇到纯数字的单元格,即为存储价格信息的单元格,记录价格单元格的总个数。
4.根据权利要求1所述智能解析excel格式国际机票运价单的方法,其特征在于:一个价格信息单元对应一条航程,步骤(7)中根据步骤(6)所查找到的价格单元对航程进行拆分 ,包括以下步骤:
(a)利用Java自带的API找到步骤(4)中所分析归纳的检索标志;
(b)根据步骤(4)中分析总结的,所需运价信息与检索标志之间的关系,找出价格信息单元对应的所有运价信息;
(c)对每一个价格信息单元重复步骤(a)和(b),直到将表格按照统一格式拆分成多条航程。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华南理工大学,未经华南理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201410336305.X/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种网页相似度计算方法及装置
- 下一篇:基于列存储的智能双引擎分析系统及方法