[发明专利]一种基于混合分类器的文本分类装置在审
申请号: | 201611254041.9 | 申请日: | 2016-12-30 |
公开(公告)号: | CN108268461A | 公开(公告)日: | 2018-07-10 |
发明(设计)人: | 何伟潮;单小红;麻建;吴剑文 | 申请(专利权)人: | 广东精点数据科技股份有限公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30;G06K9/62 |
代理公司: | 北京隆源天恒知识产权代理事务所(普通合伙) 11473 | 代理人: | 闫冬 |
地址: | 510630 广东省广*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开一种基于混合分类器的文本分类装置,其包括:用于录入文本的输入模块,用于对文本进行格式化,索引等处理的预处理模块,用于对文本进行分类的BP神经网络模块,用于判断所述BP神经网络模块分类效果好坏的判断模块,用于对文本进行分类的朴素贝叶斯模块,用于输出分类结果的输出模块。本发明结合了BP神经网络与朴素贝叶斯两种分类方法,由于BP神经网络输出向量的最大分量与第二大分量取值相近时,可能会使分类结果不准确,针对这一缺点,引入朴素贝叶斯分类算法对其做出改进,结合各自的优势,本发明能有效提高分类计算效率与分类准确率,能广泛应用到文本分类当中。 | ||
搜索关键词: | 文本 文本分类装置 分类 混合分类器 分类结果 贝叶斯 贝叶斯分类算法 格式化 分类准确率 预处理模块 分类效果 计算效率 判断模块 输出模块 输出向量 输入模块 文本分类 最大分量 索引 录入 输出 引入 应用 改进 | ||
【主权项】:
1.一种基于混合分类器的文本分类装置,其特征在于,包括:输入模块:其用于录入需要分类的文本;预处理模块:其用于对文本进行格式化,索引,统计,特征提取等处理;BP神经网络模块:其用于通过BP神经网络对文本进行分类;判断模块:其用于处理所述BP神经网络模块分类结果,并判断其效果好坏;朴素贝叶斯模块:其用于当所述BP神经网络模块的分类效果不好时,通过朴素贝叶斯分类器对文本进行分类;输出模块:其用于输出所述BP神经网络模块或所述朴素贝叶斯模块的分类结果。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于广东精点数据科技股份有限公司,未经广东精点数据科技股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201611254041.9/,转载请声明来源钻瓜专利网。