[发明专利]一种基于类别从属度的信息分类方法及系统有效
申请号: | 201410117588.9 | 申请日: | 2014-03-26 |
公开(公告)号: | CN104951455B | 公开(公告)日: | 2018-05-25 |
发明(设计)人: | 叶茂;徐剑波;汤帜;王元龙;金立峰 | 申请(专利权)人: | 北大方正集团有限公司;北京方正阿帕比技术有限公司;北京大学 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 北京三聚阳光知识产权代理有限公司 11250 | 代理人: | 寇海侠 |
地址: | 100871 北京市*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 分类 分析数据 从属度 信息分类 参考 参考信息 从属关系 分类结果 量化指标 全局最优 用户提供 可比性 从属 | ||
本发明提供一种基于类别从属度的信息分类方法及系统,首先确定所有分类以及参考分类,然后确定待分析数据对应所述参考分类中每个分类的参考值,再确定待分析数据对于每个分类的类别从属度,然后根据该类别从属度来进行信息分类,获得分类结果,该方案通过计算类别从属度进行信息分类,很好的表示出待分析数据与全部或部分分类之间的从属关系强度,从而实现对待分析数据的分类,并提供待分析数据属于各个分类的从属程度的量化指标,不仅可以得到基于全部分类的全局最优分类,还可以得到基于部分分类的局部最优分类,使用户一目了然的知道了待分析数据与各个的分类的关系,而且其与各个分类之间的关系具有可比性,为用户提供更多的分类参考信息。
技术领域
本发明涉及电子数字处理领域,具体地说是一种衡量某个数据属于某个分类的程度的类别从属度信息分类方法。
背景技术
当今社会中数据信息日益庞大,为了在海量的数据中,更好的获取所需的数据,需要对数据进行分类。数据分类是根据一定的规则将某个数据划分到某个分类中。如有监督的数据分类方法,依靠小样本学习后得到的模型,对其他更大范围的未分类数据进行分类。根据一定的规则,将某一个数据最终划到一个类别中。
但是,在进行分类时,用户不仅会关注一个数据被分到了某个分类,除了这个分类信息之外,在所关注的分类中,用户可能还需要知道数据属于分类的程度,即类别从属度。目前的分类技术,例如liblinear SVM分类技术,可以提供分类信息,但不能提供类别从属度信息。例如,一本书籍介绍餐饮娱乐信息,分类体系中有餐饮、娱乐、军事、政治等分类,基于该分类体系,该书籍可能会被分到餐饮或娱乐中的一个类别。假设该书籍被分到了餐饮类,则用户最终可以获取该书籍属于餐饮类这一个信息,但是,对于用户而言,可能还需要了解,针对餐饮和娱乐这两个他所关注的分类,该书籍属于餐饮类的程度或属于娱乐类的程度这一信息。此外,针对某个分类下的数据,如果能更好的提供其属于其他分类的程度,也会为用户提供更多的参考信息,让用户获得数据时具有更好的参考信息。例如,对于被分到餐饮类的书籍,用户可能还想获知其属于历史还是属于娱乐的程度大,如果能够提供该餐饮类下的书籍,属于其他类的程度,也会为用户提供更多的参考信息。
发明内容
为此,本发明所要解决的技术问题在于现有技术中仅提供对数据的分类,不能提供数据属于分类的程度、不能为用户提供更多的参考信息,从而提出一种既可以得到基于全部分类的全局最优分类,还可以得到基于部分分类的局部最优分类,为用户了提供更多的参考信息的基于类别从属度的信息分类方法。
为解决上述技术问题,本发明的提供一种基于类别从属度的信息分类方法,包括如下步骤:
确定所有分类;
确定参考分类,其中,所述参考分类为所有分类中的一部分或全部;
确定待分析数据对应所述参考分类中每个分类的参考值;
对于每个分类,根据待分析数据在该分类的参考值和待分析数据对应该参考分类中每个分类的参考值,确定待分析数据对于该分类的类别从属度;
根据获取的待分析数据对于参考分类中每个分类的类别从属度进行信息分类,得到分类结果。
一种基于类别从属度的信息分类系统,包括:
所有分类确定模块:确定所有分类;
参考分类确定模块:确定参考分类,其中,所述参考分类为部分分类或所有分类;
参考值计算模块:确定待分析数据对应所述参考分类中每个分类的参考值;
类别从属度计算模块:对于每个分类,根据待分析数据在该分类的参考值和待分析数据对应该参考分类中每个分类的参考值,确定待分析数据对于该分类的类别从属度:
分类模块:根据获取的待分析数据对于参考分类中每个分类的类别从属度进行信息分类,得到分类结果。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北大方正集团有限公司;北京方正阿帕比技术有限公司;北京大学,未经北大方正集团有限公司;北京方正阿帕比技术有限公司;北京大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201410117588.9/2.html,转载请声明来源钻瓜专利网。