[发明专利]内容过滤的方法、装置及系统有效
申请号: | 201110456467.3 | 申请日: | 2011-12-30 |
公开(公告)号: | CN102542063A | 公开(公告)日: | 2012-07-04 |
发明(设计)人: | 张辉;姜南;范家星 | 申请(专利权)人: | 华为技术有限公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 北京中博世达专利商标代理有限公司 11274 | 代理人: | 申健 |
地址: | 518129 广东*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 内容 过滤 方法 装置 系统 | ||
技术领域
本发明涉及通信技术领域,尤其涉及一种内容过滤的方法、装置及系统。
背景技术
随着互联网的发展,人们通过互联网能够获得越来越多的信息。为了在大量的信息中过滤有害信息,为人们提供有益信息,目前使用的现有技术为基于词与词频统计分类的内容过滤方法。所述基于词与词频统计分类的内容过滤方法,主要根据网络信息中词与对应词频特征提取语义特征向量,根据对语义特征向量的分析来对网络内容进行控制,用以过滤有害信息。
在实现上述网络内容过滤的过程中,发明人发现现有技术中至少存在如下问题:基于词与词频统计分类的内容过滤方法,由于使用基于词与词频的统计方法而导致不能理解文本信息的语义,不能处理词与词频特征相似,但语义相反的网络信息,降低了内容过滤的准确率;而且,这种方法由于处理的信息过多而导致使用的语义特征向量维度巨大,加剧文本分类的训练时间,增加过滤时的运算代价,降低了内容过滤的效率。
发明内容
本发明的实施例提供一种内容过滤的方法、装置及系统,提高内容过滤的准确率和效率。
为达到上述目的,本发明的实施例采用如下技术方案:
一种内容过滤的方法,包括:
获取待过滤的网络内容片断;
根据事件元素提取规则,对所述待过滤的网络内容片断进行事件元素提取,并按照事件模板将提取的事件元素生成对应于所述待过滤的网络内容片断的语义特征向量;
根据事件分类模型,对所述语义特征向量进行正负类类别判断;
若所述对应于所述待过滤的网络内容片断的语义特征向量被判定为负类,则对所述待过滤的网络内容片断对应的网络内容进行过滤处理。
一种内容过滤的装置,包括:
获取单元,用于获取待过滤的网络内容片断;
特征向量生成单元,用于根据事件元素提取规则,对所述待过滤的网络内容片断进行事件元素提取,并按照事件模板将提取的事件元素生成对应于所述待过滤的网络内容片断的语义特征向量;
第一判断单元,用于根据事件分类模型,对所述语义特征向量进行正负类类别判断;
过滤单元,用于在所述对应于所述待过滤的网络内容片断的语义特征向量被判定为负类时,对所述待过滤的网络内容片断对应的网络内容进行过滤处理。
一种通信系统,包括:
深度报文检测DPI设备,用于获取待过滤的网络内容片断;根据事件元素提取规则,对所述待过滤的网络内容片断进行事件元素提取,并按照事件模板将提取的事件元素生成对应于所述待过滤的网络内容片断的语义特征向量;根据事件分类模型,对所述语义特征向量进行正负类类别判断;若所述对应于所述待过滤的网络内容片断的语义特征向量被判定为负类,则对所述待过滤的网络内容片断对应的网络内容进行过滤处理。
计费服务器,用于对所述DPI设备进行过滤处理后且传输过来的网络内容进行计费。
本发明实施例提供的内容过滤的方法、装置及系统,通过使用对应于待过滤的所述网络内容片断的语义特征向量,并结合事件分类模型对所述待过滤的所述网络内容片断进行过滤处理,能够准确理解网络内容,提高了内容过滤的准确率;并且,与根据网络内容整体提取语义特征向量相比,网络内容片断的语义特征向量的使用,降低了过滤时的运算代价。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明实施例1中的一种内容过滤的方法流程图;
图2为本发明实施例2中的一种内容过滤的方法流程图;
图3为本发明实施例3中的一种内容过滤的方法流程图;
图4为本发明实施例4中的一种内容过滤的装置的组成框图;
图5为本发明实施例4中的另一种内容过滤的装置的组成框图;
图6为本发明实施例4中的另一种内容过滤的装置的组成框图;
图7为本发明实施例4中的另一种内容过滤的装置的组成框图;
图8为本发明实施例4中的另一种内容过滤的装置的组成框图;
图9为本发明实施例4中的另一种内容过滤的装置的组成框图;
图10为本发明实施例4中的另一种内容过滤的装置的组成框图;
图11为本发明实施例4中的另一种内容过滤的装置的组成框图;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华为技术有限公司,未经华为技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201110456467.3/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种数据报文的处理方法、装置及系统
- 下一篇:一种球形叶片式压缩机
- 内容再现系统、内容提供方法、内容再现装置、内容提供装置、内容再现程序和内容提供程序
- 内容记录系统、内容记录方法、内容记录设备和内容接收设备
- 内容服务系统、内容服务器、内容终端及内容服务方法
- 内容分发系统、内容分发装置、内容再生终端及内容分发方法
- 内容发布、内容获取的方法、内容发布装置及内容传播系统
- 内容提供装置、内容提供方法、内容再现装置、内容再现方法
- 内容传输设备、内容传输方法、内容再现设备、内容再现方法、程序及内容分发系统
- 内容发送设备、内容发送方法、内容再现设备、内容再现方法、程序及内容分发系统
- 内容再现装置、内容再现方法、内容再现程序及内容提供系统
- 内容记录装置、内容编辑装置、内容再生装置、内容记录方法、内容编辑方法、以及内容再生方法