[发明专利]一种基于大数据与神经网络的信息智能拦截方法在审
申请号: | 202110103304.0 | 申请日: | 2021-01-26 |
公开(公告)号: | CN112905989A | 公开(公告)日: | 2021-06-04 |
发明(设计)人: | 骆利华;徐锐 | 申请(专利权)人: | 杭州宽信科技有限公司 |
主分类号: | G06F21/45 | 分类号: | G06F21/45;G06F40/289;G06F40/30;G06N3/04;G06N3/08 |
代理公司: | 杭州快知知识产权代理事务所(特殊普通合伙) 33293 | 代理人: | 杨冬玲 |
地址: | 310000 浙江省杭州市*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 数据 神经网络 信息 智能 拦截 方法 | ||
本发明公开了一种基于大数据与神经网络的信息智能拦截方法,包括以下步骤:获取待识别信息中第一目标内容的第一词向量,将所述第一词向量输入神经网络模型进行训练,输出所述第一目标内容的第一置信度;获取垃圾信息中包含预设第二目标内容的概率,根据所述概率和所述第一置信度进行模型训练,输出所述待识别信息的第二置信度;获取发送所述待识别信息的通讯方式的过往信用记录,基于所述第二置信度和所述过往信用记录判断是否对所述待识别信息进行拦截。本方法对包含网络链接、第三方平台账号的信息进行有效识别、降低漏拦概率的同时,减少对有些包含类垃圾信息关键词的非垃圾信息以及一些玩笑类信息误拦截现象的发生。
技术领域
本发明涉及通讯技术领域,尤其涉及一种基于大数据与神经网络的信息智能拦截方法。
背景技术
随着网络登录与用户身份认证等安全性问题的不断渗透,信息行业迎来了复苏时期,2019年全国信息业务量比上年增长37.5%,增速提高了23.5个百分点,信息行业复苏与互联网的共同发展导致信息的内容与种类不再是单一的形式,网络链接、第三方平台账号、网络用语等内容出现在信息文本中,推销信息、淘宝刷单、传销散播等形式也层出不穷,现如今的信息拦截大部分采用关键词识别与匹配、信息中心黑名单匹配等技术,对于包含网络链接、第三方平台账号的信息不能进行有效的拦截,存在一定的漏拦概率,同时,有些包含类垃圾信息关键词的非垃圾信息以及一些玩笑类信息,采用当前的信息拦截技术会发生误拦截现象。
现有技术中通过获取待识别信息的发送方身份信息和信息文本数据;对关键词集合进行词向量处理并输入至关键词模型中得到M个标签,计算关键词标签与预设标签的匹配度,并根据设定的阈值进行判断得出信息的标签,根据该标签获得信息的属性,对于信息发送方信息为表征信息,如姓名、号码、地址等,该信息识别方法能够对待识别信息进行更为细致的标识,也即,能够对待识别信息进行更为细致的分类,通过对其更为细致的分类来提高分类的准确率,但是还是存在如下缺陷:对于含有网络链接、第三方平台账号的信息未进行有效的拦截,只获取发送方的姓名、号码与地址,未对发送方发送信息次数与信用度进行判断,存在误拦截的现象。
发明内容
本发明提供的一种基于大数据与神经网络的信息智能拦截方法,旨在解决现有技术中对于信息中包含的网络链接、第三方平台账号不能进行有效拦截或对信息进行误拦截的问题。
为实现上述目的,本发明采用以下技术方案:
本发明的一种基于大数据与神经网络的信息智能拦截方法,包括以下步骤:
获取待识别信息中第一目标内容的第一词向量,将所述第一词向量输入神经网络模型进行训练,输出所述第一目标内容的第一置信度;
获取垃圾信息中包含预设第二目标内容的概率,根据所述概率和所述第一置信度进行模型训练,输出所述待识别信息的第二置信度;
获取发送所述待识别信息的通讯方式的过往信用记录,基于所述第二置信度和所述过往信用记录判断是否对所述待识别信息进行拦截。
利用正则表达式进行信息文本的语义分析,获得关键词、网络链接、第三方平台账号的词向量等语义特征,通过多层神经网络模型对语义特征进行训练,快速的检测与判断信息是否为垃圾信息的置信度,降低了漏拦截的概率,同时结合大数据对发送该垃圾信息的通讯方式进行发送垃圾信息次数和信用度的监测,进行综合判定,减少误拦截现象的发生。
作为优选,获取待识别信息中第一目标内容的第一词向量,将所述第一词向量输入神经网络模型进行并行训练,输出所述第一目标内容的第一置信度,包括:
利用正则表达式对所述待识别信息进行语义分析,获取所述待识别信息中第一目标内容的第一词向量,所述第一目标内容包含关键词、网络链接、第三方平台账号;
预设所述第二目标内容的第二词向量,所述第二目标内容包含非法关键词、非法网络链接、非法第三方平台账号,将所述第一词向量和第二词向量输入神经网络模型;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于杭州宽信科技有限公司,未经杭州宽信科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110103304.0/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种LED光源模组安装机构
- 下一篇:一种防水纤维针织面料及其制备方法
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 信息记录介质、信息记录方法、信息记录设备、信息再现方法和信息再现设备
- 信息记录装置、信息记录方法、信息记录介质、信息复制装置和信息复制方法
- 信息记录装置、信息再现装置、信息记录方法、信息再现方法、信息记录程序、信息再现程序、以及信息记录介质
- 信息记录装置、信息再现装置、信息记录方法、信息再现方法、信息记录程序、信息再现程序、以及信息记录介质
- 信息记录设备、信息重放设备、信息记录方法、信息重放方法、以及信息记录介质
- 信息存储介质、信息记录方法、信息重放方法、信息记录设备、以及信息重放设备
- 信息存储介质、信息记录方法、信息回放方法、信息记录设备和信息回放设备
- 信息记录介质、信息记录方法、信息记录装置、信息再现方法和信息再现装置
- 信息终端,信息终端的信息呈现方法和信息呈现程序
- 信息创建、信息发送方法及信息创建、信息发送装置