[发明专利]一种基于类别从属度的信息分类方法及系统有效
申请号: | 201410117588.9 | 申请日: | 2014-03-26 |
公开(公告)号: | CN104951455B | 公开(公告)日: | 2018-05-25 |
发明(设计)人: | 叶茂;徐剑波;汤帜;王元龙;金立峰 | 申请(专利权)人: | 北大方正集团有限公司;北京方正阿帕比技术有限公司;北京大学 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 北京三聚阳光知识产权代理有限公司 11250 | 代理人: | 寇海侠 |
地址: | 100871 北京市*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 分类 分析数据 从属度 信息分类 参考 参考信息 从属关系 分类结果 量化指标 全局最优 用户提供 可比性 从属 | ||
1.一种基于类别从属度的信息分类方法,其特征在于,包括如下步骤:
确定所有分类;
确定参考分类,其中,所述参考分类为所有分类中的一部分或全部;
确定待分析数据对应所述参考分类中每个分类的参考值;
对于每个分类,根据待分析数据在该分类的参考值和待分析数据对应该参考分类中每个分类的参考值,确定待分析数据对于该分类的类别从属度;
根据获取的待分析数据对于参考分类中每个分类的类别从属度进行信息分类,得到分类结果,包括:预设一个分类阈值,将大于预设分类阈值的类别从属度及其对应的分类,作为分类结果。
2.根据权利要求1所述的信息分类方法,其特征在于,所述待分析数据在所述参考分类中对应每个分类的参考值为:待分析数据到该分类与其余分类的分类超平面的距离值。
3.根据权利要求1或2所述的信息分类方法,其特征在于,在所述确定待分析数据对应所述参考分类中每个分类的参考值的过程,包括:
使用选择的类别训练语料来训练liblinear SVM分类器;
使用训练后的分类器对待分析数据进行分类,计算待分析数据在所有分类中对应于每个分类的参考值,所述参考值为待分析数据到每个分类与其他分类的分类超平面的距离。
4.根据权利要求1或2所述的信息分类方法,其特征在于,所述待分析数据在所述参考分类中对应每个分类的参考值为:采用K-NS分类算法获得的待分析数据到分类的距离。
5.根据权利要求1或2所述的信息分类方法,其特征在于,所述对于每个分类,根据待分析数据在该分类的参考值和待分析数据对应该参考分类中每个分类的参考值,确定待分析数据对于该分类的类别从属度的计算公式为:
其中,c
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北大方正集团有限公司;北京方正阿帕比技术有限公司;北京大学,未经北大方正集团有限公司;北京方正阿帕比技术有限公司;北京大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201410117588.9/1.html,转载请声明来源钻瓜专利网。