[发明专利]一种篡改文本的识别方法及装置有效
申请号: | 201711286637.1 | 申请日: | 2017-12-07 |
公开(公告)号: | CN108038101B | 公开(公告)日: | 2021-04-27 |
发明(设计)人: | 王树太;李杰;吴庆 | 申请(专利权)人: | 杭州迪普科技股份有限公司 |
主分类号: | G06F40/289 | 分类号: | G06F40/289;G06F40/253;G06F40/30;G06F21/64 |
代理公司: | 北京博思佳知识产权代理有限公司 11415 | 代理人: | 林祥 |
地址: | 310051 浙江省杭*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 篡改 文本 识别 方法 装置 | ||
本申请提供一种篡改文本的识别方法及装置。一种篡改文本的识别方法,包括:根据已建立的语义库,识别目标文本所属的领域,所述语义库中保存有参考词汇与各领域的关联度;当所述目标文本所属的领域与目标领域不相同时,确定所述目标文本被篡改。本申请可提高对篡改文本的识别效率。
技术领域
本申请涉及互联网领域,尤其涉及一种篡改文本的识别方法及装置。
背景技术
随着信息化的发展,大多数企业通常会在自己的官网上发布本企业所涉及的业务等信息,例如一互联网公司会在本公司官网上发布本公司在互联网领域的相关业务信息等,用于向客户介绍企业业务以及进行企业宣传。
但随之而来的是,不免会存在一些恶意用户通过盗取管理员账号在企业官网发布虚假信息,或者发布违背企业发布者意图的信息,这样的恶意攻击事件将极有可能给企业造成不良影响。
现有技术中,可通过人工对要发布的信息进行审核,在确定上述信息正常后方可允许发布该信息。此外,网站也可通过自动向用户发送短信等方式对用户身份进行验证,身份验证通过后可允许用户发布信息。从而可避免恶意用户的攻击。
但采用现有技术人工审核的方案,审核效率较低;而采用短信等方式验证用户身份的方案,对企业来说,网站的使用较为繁琐,并且网站的维护成本较高。
发明内容
有鉴于此,本申请提供一种篡改文本的识别方法及装置,以提高对篡改文本的识别效率。
具体地,本申请是通过如下技术方案实现的:
一种篡改文本的识别方法,包括:
根据已建立的语义库,识别目标文本所属的领域,所述语义库中保存有参考词汇与各领域的关联度;
当所述目标文本所属的领域与目标领域不相同时,确定所述目标文本被篡改。
可选的,所述根据已建立的语义库,识别目标文本所属的领域,包括:
根据已建立的语义库,计算所述目标文本与各领域的目标交叉度;
将最大目标交叉度对应的领域确定为所述目标文本所属的领域。
可选的,所述方法还包括:
当所述目标文本所属的领域与所述目标领域相同,且所述最大目标交叉度大于等于参考交叉度时,确定所述目标文本未被篡改;
所述参考交叉度是所述目标领域中参考文本与所述目标领域的交叉度。
可选的,所述方法还包括:
当所述目标文本所属的领域与所述目标领域相同,但所述最大目标交叉度小于所述参考交叉度时,判断所述最大目标交叉度与所述参考交叉度的方差是否在第一预设范围内;
若在所述第一预设范围内,则确定所述目标文本未被篡改;
若不在所述第一预设范围内,则确定所述目标文本被篡改。
可选的,所述方法还包括:
根据所述语义库,计算所述目标文本与非目标领域的目标外延度;
当所述最大目标交叉度与所述参考交叉度的方差在第一预设范围内时,判断所述目标外延度与参考外延度的方差是否在第二预设范围内,所述参考外延度是所述目标领域中参考文本与所述非目标领域的外延度;
若在所述第二预设范围内,则确定所述目标文本未被篡改;
若不在所述第二预设范围内,则确定所述目标文本被篡改。
可选的,所述语义库的建立过程包括:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于杭州迪普科技股份有限公司,未经杭州迪普科技股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201711286637.1/2.html,转载请声明来源钻瓜专利网。
- 上一篇:泥鳅的养殖技术
- 下一篇:一种适于不同尺寸工件夹持的夹持装置