[发明专利]一种信息规则生成方法及装置、信息类型判断方法及系统无效

专利信息
申请号: 200710049315.5 申请日: 2007-06-18
公开(公告)号: CN101329668A 公开(公告)日: 2008-12-24
发明(设计)人: 耿技;刘勇;张凤荔;郑梅;邓蔚;李晓 申请(专利权)人: 电子科技大学
主分类号: G06F17/30 分类号: G06F17/30;H04L12/24
代理公司: 暂无信息 代理人: 暂无信息
地址: 610054四*** 国省代码: 四川;51
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 信息 规则 生成 方法 装置 类型 判断 系统
【说明书】:

技术领域

发明涉及互联网技术,具体涉及一种网络信息特征规则生成方法及装置、网络信息类型判断方法及系统。

背景技术

近年来,随着互连网的发展,垃圾信息问题越来越引起人们的重视。比如不请自来的垃圾邮件问题、垃圾网页问题、垃圾短信问题和日益增多的垃圾即时通信信息问题等,无时无刻的困扰着互连网用户,浪费网络资源,甚至可能引起其他更加严重的社会问题。随着技术的发展,垃圾信息过滤技术也得到了越来越多的关注和发展。

今年来,机器学习方法得到了很大的发展,也成功应用到垃圾信息的过滤上。基于机器学习方法的网络信息内容过滤器是近年来的研究热点。1998年Sahami将朴素贝叶斯NB(Naive Bayes)方法用于垃圾邮件过滤,更是取得了巨大的成功。此后,越来越多的机器学习方法用于垃圾网络信息过滤,特别是很多文本分类的方法可以直接用于垃圾信息的过滤问题中,比如启发式规则、潜在语义索引LSI(Latent Semantic Index)技术、支持向量机SVM(support vector machine)方法、基于实例的学习方法(包括最近邻方法和基于案例的推理)以及最大墒方法等。

贝叶斯过滤器是其中非常简单有效的方法,在商业反垃圾信息软件中得到了广泛的应用。它的本质是一种分类方法,将垃圾信息和非垃圾信息分为两类,通过对训练样本库的分析,得到各特征词在垃圾信息和正常信息中分别出现的初始概率。对于新到信息,首先抽取特征词,根据训练样本库中学习的概率计算新到信息分类为垃圾信息或者非垃圾信息的概率。同时,也将该信息放入训练样本库,以便不断修正初始概率。

贝叶斯过滤器的准确性相当高,但是它的缺点是需要维护训练样本库,而这个样本库通常是需要用户的参与。

发明内容

本发明实施例的目的是提供一种网络信息特征规则生成方法及装置、网络信息类型判断方法、装置及系统,使用本发明提供的实施例,可以对网络信息的信息类型进行判断,从而过滤网络垃圾信息。

为了解决现有技术存在的问题,本发明的实施方式提出了一种网络信息特征规则生成的方法,该方法的步骤包括:

读取分类已知信息的内容;

将所述信息内容使用预置提取算法得到信息规则库;

采用所述的信息规则库使用预置学习算法进行概率分析得到最终特征集合;

将所述概率使用预置分析算法进行分数优化得到最终分数集。

相应地,本发明的实施方式提出了一种网络信息特征规则生成装置,该装置包括:

网络信息读取单元,用于读取分类已知信息的信息内容;

特征库提取单元,用于从所述信息内容中提取符合预置条件的特征;

规则集生成单元,用于将所述特征进行概率分析得到最终的规则集合;

规则分数生成单元,用于将所述规则概率进行优化得到最终的分数集合。

另一方面,本发明的实施方式还提供了一种网络信息类型判断的方法,该方法的步骤包括:

读取分类未知信息的内容

对所述信息内容进行格式解析;

读取所述的网络信息特征规则生成方法得到的规则库和分数集;

对所述解析后的信息内容使用预置预测算法进行计算;

根据计算结果对所述信息类型进行判断。

相应地,本发明的实施方式提出了一种网络信息类型判断装置,该装置包括:

网络信息读取单元,用于读取分类未知信息的信息内容;

信息内容解析单元,用于解析分类未知信息的信息内容;

规则与分数集读取单元,用于读取规则集与对应分数集内容;

计算单元,用于以所述解析后的信息内容、规则集和分数集作为输入,采用预置预测算法进行计算;

判断单元,用于根据所述计算单元的计算结果对所述分类未知信息的信息类型进行判断。

最后,实施本发明具有以下有益效果:

从本发明实施例提供的以上技术方案可以看出,本发明实施例采用分类已知的网络信息的信息特征规则生成方法,并使用生成的特征对分类未知的信息进行判断,由于这些规则可以动态的调整和修改。同时垃圾信息过滤器充分利用了统计技术,可以自动地“学习”接收信息的特点,来调整垃圾信息的分值。除了设置内部的规则之外,垃圾信息过滤器也可以访问其它外部的同类型的垃圾信息库,这样可以进一步增强其适用性。

附图说明

图1为本发明网络信息特征规则生成方法实施例一的具体流程图;

图2为本发明网络信息类型判断方法实施例一的具体流程图;

图3为本发明网络信息特征规则生成装置实施例一的结构图;

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于电子科技大学,未经电子科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/200710049315.5/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top