[发明专利]异常文本检测方法、异常文本序列检测方法及装置有效

专利信息
申请号: 201910058966.3 申请日: 2019-01-22
公开(公告)号: CN111460110B 公开(公告)日: 2023-04-25
发明(设计)人: 康杨杨;孙常龙;刘晓钟;司罗 申请(专利权)人: 阿里巴巴集团控股有限公司
主分类号: G06F16/332 分类号: G06F16/332
代理公司: 北京合智同创知识产权代理有限公司 11545 代理人: 李杰
地址: 英属开曼群岛大开*** 国省代码: 暂无信息
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 异常 文本 检测 方法 序列 装置
【说明书】:

发明实施例提供了一种异常文本检测方法、异常文本序列检测方法及装置。其中,所述异常文本检测方法,包括:从原始文本序列中,获得包含当前输入文本的输入文本序列,所述输入文本序列包括至少两个输入文本;对所述输入文本序列中的选定间隔的相邻输入文本进行计算,得到所述相邻输入文本间的第一差异信息;确定所述当前输入文本与经过历史检测确定的异常文本间的第二差异信息;至少根据所述第一差异信息与所述第二差异信息确定所述当前输入文本是否为异常文本。通过本发明实施例,可以准确检测异常文本。

技术领域

本发明实施例涉及计算机技术领域,尤其涉及一种异常文本检测方法、异常文本序列检测方法及装置。

背景技术

随着科技的发展,人们的交流越来越多地通过电子信息交流,例如,通过文本信息进行交流。但是,这种通信方式存在着一些不良用户发送异常文本的情况。例如,发送各种骚扰信息、推广信息、诈骗类信息等。为了有效杜绝这些情况,净化通信环境,通常会针对每个输入文本进行检测确定其是否为异常文本,但现有的异常文本因检测准确性不足,造成异常文本检测效果不佳。

发明内容

有鉴于此,本发明实施例提供一种异常文本检测方案,以解决上述问题。

根据本发明实施例的第一方面,提供了一种异常文本检测方法,包括:获得包含当前输入文本的输入文本序列,所述输入文本序列包括至少两个输入文本;对所述输入文本序列中的选定间隔的相邻输入文本进行计算,得到所述相邻输入文本间的第一差异信息;确定所述当前输入文本与经过历史检测确定的异常文本间的第二差异信息;至少根据所述第一差异信息与所述第二差异信息确定所述当前输入文本是否为异常文本。

根据本发明实施例的第二方面,提供了一种异常文本序列检测方法包括:根据上述的异常文本检测方法确定原始文本序列中各所述输入文本是否为异常文本;根据各所述输入文本的检测结果,确定所述各输入文本所在的原始文本序列是否为异常序列。

根据本发明实施例的第三方面,提供了一种异常文本检测装置,包括:第一序列获取模块,用于获得包含当前输入文本的输入文本序列,所述输入文本序列包括至少两个输入文本;第一差异获取模块,用于对所述输入文本序列中的选定间隔的相邻输入文本进行计算,得到所述相邻输入文本间的第一差异信息;第二差异获取模块,用于确定所述当前输入文本与经过历史检测确定的异常文本间的第二差异信息;异常检测模块,用于至少根据所述第一差异信息与所述第二差异信息确定所述当前输入文本是否为异常文本。

根据本发明实施例的第四方面,提供了一种异常文本序列检测装置,所述装置使用上述的异常文本检测装置确定原始文本序列中各所述输入文本是否为异常文本;并根据各所述输入文本的检测结果,确定所述各输入文本所在的原始文本序列是否为异常序列。

根据本发明实施例提供的异常文本检测方案,根据输入文本序列中相邻输入文本间的第一差异信息、当前输入文本与经过历史检测确定异常文本间的第二差异信息,确定所述当前输入文本是否为异常文本。这样综合考虑了多个输入文本间的差异、以及当前输入文本与历史检测确定为异常文本间的差异,提升了检测时考虑因素的全面性,避免了现有技术中只孤立地检测当前输入文本,致使通过简单修改就能规避检测的问题,进而使检测更加准确。

附图说明

为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明实施例中记载的一些实施例,对于本领域普通技术人员来讲,还可以根据这些附图获得其他的附图。

图1为根据本发明实施例一的一种异常文本检测方法的步骤流程图;

图2为根据本发明实施例二的一种异常文本检测方法的步骤流程图;

图3为根据本发明实施例三的一种异常文本检测方法的步骤流程图;

图4为根据本发明实施例四的一种异常文本检测方法的步骤流程图;

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于阿里巴巴集团控股有限公司,未经阿里巴巴集团控股有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201910058966.3/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top