[发明专利]一种从企业名称数据中提取区域信息的方法及系统有效
申请号: | 201210085428.1 | 申请日: | 2012-03-23 |
公开(公告)号: | CN102651013A | 公开(公告)日: | 2012-08-29 |
发明(设计)人: | 陈扬;王绍虎 | 申请(专利权)人: | 上海安捷力信息系统有限公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 北京邦信阳专利商标代理有限公司 11012 | 代理人: | 王昭林;项京 |
地址: | 200335 上海*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 企业名称 数据 提取 区域 信息 方法 系统 | ||
技术领域
本发明涉及企业数据的数据处理技术,特别涉及一种从企业名称数据中提取区域信息的方法及系统。
背景技术
在对企业数据进行数据处理过程中,获得企业的区域信息是其中非常重要的步骤。如果企业数据中缺少企业的区域信息,这些企业数据就无法被有效的利用,降低了企业相关数据分析的质量,因此相关企业急切的需要包含区域信息的企业数据。
大多数情况下,在省、市一级的企业名称中都包含企业的区域信息,例如:上海市第一人民医院等。而在销售的下游渠道,企业名称越来越不规范,特别是在销售渠道末端的企业,经常出现不包含区域信息或区域信息不全的企业名称。这些企业名称被录入企业数据中进行数据处理时,需要将企业的区域信息补充完整。
现阶段在对企业数据进行区域信息和补充操作时,往往利用相关的销售人员在销售期间对地域信息进行收集和补全,或者向专业的信息调查公司购买相关的服务。显而易见,这两种方式在实际操作时都需要投入大量的人力进行相关的普查工作,并且由于是纯人工操作,整个过程的实施周期会很长,企业需要为此花费相当多的资源。
发明内容
有鉴于此,本发明的目的在于一种从企业名称数据中提取区域信息的方法及系统,以提高获取区域信息的工作效率。
为达到上述目的的第一个方面,本发明提供了一种从企业名称数据中提取区域信息的方法,包括如下步骤:
A、将接收的企业名称数据中的企业名称与预先设置的企业信息数据库中的企业名称进行完全匹配;所述企业信息数据库中存储有企业名称及对应的完整区域信息;对完全匹配的数据,从企业信息数据库中提取出对应的区域信息,作为该企业名称数据的区域信息;对未匹配的企业名称数据执行步骤B。
B、根据预先设置的分类词典数据库对企业名称进行词条拆分,及对拆分出的词条进行归类;对全部词条能够归类的企业名称执行步骤D,对未全部归类的企业名称执行步骤C。
C、根据预先设置的分类词典数据库,人工辅助对拆分出的未归类词条进行归类。
D、从归类后的词条中提取区域信息,作为该企业名称数据的区域信息。
为达到上述目的的另一个方面,本发明提供了一种从企业名称数据中提取区域信息的系统,该系统包括:
数据匹配单元,接收企业名称数据,将其中的企业名称与预先设置的企业信息数据库中的企业名称进行完全匹配,对完全匹配的数据,从企业信息数据库中提取出对应的区域信息,作为该企业名称数据的区域信息;将未匹配的企业名称数据输出给词条拆分归类单元。
所述企业信息数据库中存储有企业名称及对应的完整区域信息。
词条拆分归类单元,根据预先设置的分类词典数据库对企业名称进行词条拆分,并对拆分出的词条进行归类;将能够全部归类的企业名称和归类信息输出给区域信息提取单元,将未全部归类的企业名称输出给未归类词条归类工作台。
未归类词条归类工作台,根据预先设置的分类词典数据库,人工辅助对拆分出的未归类词条进行归类;将归类后的词条输出给区域信息提取单元。
区域信息提取单元,从归类后的词条中提取区域信息,作为该企业名称数据的区域信息。
由上述的技术方案可见,本发明提供的这种从企业名称数据中提取区域信息的方法及系统,通过将企业名称与企业信息数据库进行数据匹配,对匹配数据,从企业信息数据库中获取区域信息;对未匹配的数据进行拆分和归类,从归类后的信息中获得区域信息,提高了获取企业区域信息的工作效率。
附图说明
图1为本发明一较佳实施例中提取区域信息的方法流程图;
图2为本发明一较佳实施例中提取区域信息的系统的结构示意图;
图3为图2所示实施例中区域信息提取单元的结构示意图。
具体实施方式
本发明公开了一种从企业名称数据中提取区域信息的方法及系统,能够提高获取企业区域信息的工作效率。
以下参照附图并举具体实施例,对本发明进行详细的说明。
如图1所示,本发明一较佳实施例中提取区域信息的方法包括如下步骤:
步骤101,接收企业名称数据。
步骤102,将接收的企业名称数据中的企业名称与预先设置的企业信息数据库中的企业名称进行完全相似匹配,对完全匹配的数据,从企业信息数据库中提取出对应的区域信息,执行步骤103,对未匹配的企业名称数据执行步骤104。
本实施例中的企业信息数据库中存储有企业名称及对应的完整区域信息。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海安捷力信息系统有限公司,未经上海安捷力信息系统有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201210085428.1/2.html,转载请声明来源钻瓜专利网。
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置