[发明专利]一种数据整合分类方法有效
申请号: | 201710810480.1 | 申请日: | 2017-09-11 |
公开(公告)号: | CN107609097B | 公开(公告)日: | 2021-02-09 |
发明(设计)人: | 李德岭;张力伟;季楠;王韬;何建强;曹国雄;陶然;肖雄 | 申请(专利权)人: | 首都医科大学附属北京天坛医院 |
主分类号: | G06F16/35 | 分类号: | G06F16/35;G06K9/62 |
代理公司: | 北京中创阳光知识产权代理有限责任公司 11003 | 代理人: | 张宇锋 |
地址: | 100050*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 数据 整合 分类 方法 | ||
一种数据整合分类方法,分类层级不少于二级,包括步骤1与步骤2。步骤1为:将所收集到的数据与低层级分类标准进行匹配,如匹配成功,则直接将数据分类至匹配的低层级分类标准中;如匹配不成功,则进入步骤2。步骤2为:将数据与高层级分类标准进行匹配,如匹配成功,则直接将数据分类至匹配的高层级分类标准中;如匹配不成功,则数据分类失败。本发明提供的数据整合分类方法分类精度较高。
技术领域
本发明涉及数据处理技术领域,特别是一种数据整合分类方法。
背景技术
数据分类就是把具有某种共同属性或特征的数据归并在一起,通过其类别的属性或特征来对数据进行区别。为了实现数据共享和提高处理效率,必须遵循约定的分类原则和方法,按照信息的内涵、性质及管理的要求,将系统内所有信息按一定的结构体系分为不同的集合,从而使得每个信息在相应的分类体系中都有一个对应位置。
数据分类是目前数据处理的一大难题,特别是数据来源较多的情况下,由于数据录入方对于录入规则的掌握及理解各不相同,造成所收集到的数据格式各异,为了提升数据分类精度,很多时候无法通过计算机对其进行数据处理,而必须采用人工阅读的方式,造成了大量的人力成本浪费的同时,极大地降低了工作效率。
基于此,现有技术出现了一种关键词检索分类方式,即通过对所录入数据中文字信息进行关键词检索,从而将该条数据划分至相应分类的方法。这种方法在一定程度上提升了计算机分类的处理精度,但是精度仍旧较低,特别是对于一些较为通用的关键词,或是多个关键词罗列所造成的不同分类结果,使用此方法无法高精度地对数据进行分类。
发明内容
本发明所要解决的技术问题在于现有技术中的数据分类方法分类精度较低,而提供了一种使用计算机自动进行分类,且分类结果精度较高的数据分类方法。
为解决上述技术问题,本发明采用的技术方案如下:
一种数据整合分类方法,所述分类层级不少于二级,包括以下步骤:
步骤1:将所收集到的数据与低层级分类标准进行匹配,如匹配成功,则直接将所述数据分类至匹配的所述低层级分类标准中;如匹配不成功,则进入步骤2;
步骤2:将所述数据与高层级分类标准进行匹配,如匹配成功,则直接将所述数据分类至匹配的所述高层级分类标准中;如匹配不成功,则所述数据分类失败。
上述方法中,所述分类层级为三级,一级分类为最高级分类标准,三级分类为最低级分类标准,所述步骤1包括步骤11与步骤12;
所述步骤11为:将所述数据与所述三级分类标准进行匹配,如匹配成功,则直接将所述数据分类至匹配的所述三级分类标准中;如匹配不成功,则进入所述步骤12;
所述步骤12为:将所述数据与所述二级分类标准进行匹配,如匹配成功,则直接将所述数据分类至匹配的所述二级分类标准中;如匹配不成功,则进入步骤2;
所述步骤2为:将所述数据与所述一级分类标准进行匹配,如匹配成功,则直接将所述数据分类至匹配的所述一级分类标准中;如匹配不成功,则所述数据分类失败。
上述方法中,在所述步骤1之前,还包括制定所述分类层级的步骤0,所述步骤0为:制定所述三级分类的名称、关键词及标准编码,制定所述二级分类的名称及关键词,制定所述一级分类的名称。
上述方法中,所述步骤11中的匹配方式为:首先对所述数据的文字信息与所述三级分类的名称进行匹配,如无法匹配则对所述数据的文字信息与所述三级分类的标准编码进行匹配,如仍无法匹配则对所述数据的文字信息与所述三级分类的关键词进行匹配,如匹配仍不成功,则进入步骤12;
所述步骤12中的匹配方式为:首先对所述数据的文字信息与所述二级分类的名称进行匹配,如无法匹配则对所述数据的文字信息与所述二级分类的关键词进行匹配,如仍无法匹配则进入步骤2;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于首都医科大学附属北京天坛医院,未经首都医科大学附属北京天坛医院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710810480.1/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种智能律师专家应答方法
- 下一篇:搜索方法及装置
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置