[发明专利]一种数据整合分类方法有效

专利信息
申请号: 201710810480.1 申请日: 2017-09-11
公开(公告)号: CN107609097B 公开(公告)日: 2021-02-09
发明(设计)人: 李德岭;张力伟;季楠;王韬;何建强;曹国雄;陶然;肖雄 申请(专利权)人: 首都医科大学附属北京天坛医院
主分类号: G06F16/35 分类号: G06F16/35;G06K9/62
代理公司: 北京中创阳光知识产权代理有限责任公司 11003 代理人: 张宇锋
地址: 100050*** 国省代码: 北京;11
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 数据 整合 分类 方法
【说明书】:

一种数据整合分类方法,分类层级不少于二级,包括步骤1与步骤2。步骤1为:将所收集到的数据与低层级分类标准进行匹配,如匹配成功,则直接将数据分类至匹配的低层级分类标准中;如匹配不成功,则进入步骤2。步骤2为:将数据与高层级分类标准进行匹配,如匹配成功,则直接将数据分类至匹配的高层级分类标准中;如匹配不成功,则数据分类失败。本发明提供的数据整合分类方法分类精度较高。

技术领域

本发明涉及数据处理技术领域,特别是一种数据整合分类方法。

背景技术

数据分类就是把具有某种共同属性或特征的数据归并在一起,通过其类别的属性或特征来对数据进行区别。为了实现数据共享和提高处理效率,必须遵循约定的分类原则和方法,按照信息的内涵、性质及管理的要求,将系统内所有信息按一定的结构体系分为不同的集合,从而使得每个信息在相应的分类体系中都有一个对应位置。

数据分类是目前数据处理的一大难题,特别是数据来源较多的情况下,由于数据录入方对于录入规则的掌握及理解各不相同,造成所收集到的数据格式各异,为了提升数据分类精度,很多时候无法通过计算机对其进行数据处理,而必须采用人工阅读的方式,造成了大量的人力成本浪费的同时,极大地降低了工作效率。

基于此,现有技术出现了一种关键词检索分类方式,即通过对所录入数据中文字信息进行关键词检索,从而将该条数据划分至相应分类的方法。这种方法在一定程度上提升了计算机分类的处理精度,但是精度仍旧较低,特别是对于一些较为通用的关键词,或是多个关键词罗列所造成的不同分类结果,使用此方法无法高精度地对数据进行分类。

发明内容

本发明所要解决的技术问题在于现有技术中的数据分类方法分类精度较低,而提供了一种使用计算机自动进行分类,且分类结果精度较高的数据分类方法。

为解决上述技术问题,本发明采用的技术方案如下:

一种数据整合分类方法,所述分类层级不少于二级,包括以下步骤:

步骤1:将所收集到的数据与低层级分类标准进行匹配,如匹配成功,则直接将所述数据分类至匹配的所述低层级分类标准中;如匹配不成功,则进入步骤2;

步骤2:将所述数据与高层级分类标准进行匹配,如匹配成功,则直接将所述数据分类至匹配的所述高层级分类标准中;如匹配不成功,则所述数据分类失败。

上述方法中,所述分类层级为三级,一级分类为最高级分类标准,三级分类为最低级分类标准,所述步骤1包括步骤11与步骤12;

所述步骤11为:将所述数据与所述三级分类标准进行匹配,如匹配成功,则直接将所述数据分类至匹配的所述三级分类标准中;如匹配不成功,则进入所述步骤12;

所述步骤12为:将所述数据与所述二级分类标准进行匹配,如匹配成功,则直接将所述数据分类至匹配的所述二级分类标准中;如匹配不成功,则进入步骤2;

所述步骤2为:将所述数据与所述一级分类标准进行匹配,如匹配成功,则直接将所述数据分类至匹配的所述一级分类标准中;如匹配不成功,则所述数据分类失败。

上述方法中,在所述步骤1之前,还包括制定所述分类层级的步骤0,所述步骤0为:制定所述三级分类的名称、关键词及标准编码,制定所述二级分类的名称及关键词,制定所述一级分类的名称。

上述方法中,所述步骤11中的匹配方式为:首先对所述数据的文字信息与所述三级分类的名称进行匹配,如无法匹配则对所述数据的文字信息与所述三级分类的标准编码进行匹配,如仍无法匹配则对所述数据的文字信息与所述三级分类的关键词进行匹配,如匹配仍不成功,则进入步骤12;

所述步骤12中的匹配方式为:首先对所述数据的文字信息与所述二级分类的名称进行匹配,如无法匹配则对所述数据的文字信息与所述二级分类的关键词进行匹配,如仍无法匹配则进入步骤2;

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于首都医科大学附属北京天坛医院,未经首都医科大学附属北京天坛医院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201710810480.1/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top