[发明专利]改进的流量平台监测方法和系统在审
申请号: | 202111557425.9 | 申请日: | 2021-12-19 |
公开(公告)号: | CN115526178A | 公开(公告)日: | 2022-12-27 |
发明(设计)人: | 苏长君;曾祥禄 | 申请(专利权)人: | 北京智美互联科技有限公司 |
主分类号: | G06F40/30 | 分类号: | G06F40/30;G06F40/211;G06N3/04;G06N3/08 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 100037 北京市西*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 改进 流量 平台 监测 方法 系统 | ||
本发明提供一种改进的流量平台监测方法和系统,通过搭建云计算平台,获取互联网数据流,使用句法分析和语义分析特征向量,给词分量赋予权重值,得到有关评论的质心向量,对质心向量进行报警判断,可以更加容易判断是否合规,极大地提高了防护效率。
技术领域
本申请涉及网络多媒体领域,尤其涉及一种改进的流量平台监测方法和系统。
背景技术
现有流量平台面临的问题是,词汇碎片化,难以提取出关键性词汇,进而较难过滤流量中的评论内容。同时云计算平台已经被广泛应用,如何在流量平台监测中用好云计算平台也是本领域的重要课题。
因此,急需一种针对性的改进的流量平台监测的方法和系统。
发明内容
本发明的目的在于提供一种改进的流量平台监测方法和系统,通过搭建云计算平台,获取互联网数据流,使用句法分析和语义分析特征向量,给词分量赋予权重值,得到有关评论的质心向量,对质心向量进行报警判断,可以更加容易判断是否合规,极大地提高了防护效率。
第一方面,本申请提供一种改进的流量平台监测方法,所述方法包括:
在服务器上搭建云计算平台,构建句法模型和语义分析模型,所述句法模型和语义分析模型分别位于云计算平台的不同核实体上,所述核实体是所述云计算平台中处于中心地位的实体服务器;
根据获取策略,获取互联网平台的数据流,将所述数据流中的特征向量输入句法模型进行断句,去除表情符号,得到词分量;
将所述词分量输入语义分析模型,输出词含义,所述词含义为去除语气词、简洁、含义唯一、使用大类的单词的语句,将所述词含义重组成新的语句,并根据所述词含义赋予权重值,将所述权重值插入所述新的语句中,完成向量化,得到第二特征向量;
其中所述第二特征向量包含了不同词含义的权重值;
计算若干个所述第二特征向量之间的相似度,将相似度高于阈值的第二特征向量组成质心向量,所述相似度是指词含义和权重值两个维度的相似程度;
计算所述质心向量的权重值的累加值,用于反映评论的相关性的度量;
过滤质心向量值低于第二阈值的词含义,判断所述词含义中是否包括指定的关键词,如果是则继续判断该词含义所在的语句是否形成了指定的含义,如果该语句形成了指定的含义,则认定对应的第二特征向量属于需要报警的情形,发出报警消息;如果该语句没有形成指定的含义,则认定对应的第二特征向量合规。
结合第一方面,在第一方面第一种可能的实现方式中,所述方法还包括风险评估、攻击关联分析和态势感知。
结合第一方面,在第一方面第二种可能的实现方式中,所述获取互联网平台的数据流包括对所述数据流的编解码。
结合第一方面,在第一方面第三种可能的实现方式中,所述语义分析模型和句法模型的内核均使用神经网络模型。
第二方面,本申请提供一种改进的流量平台监测系统,所述系统包括处理器以及存储器:
所述存储器用于存储程序代码,并将所述程序代码传输给所述处理器;
所述处理器用于根据所述程序代码中的指令执行第一方面四种可能中任一项所述的方法。
第三方面,本申请提供一种计算机可读存储介质,所述计算机可读存储介质用于存储程序代码,所述程序代码用于执行第一方面四种可能中任一项所述的方法。
本发明提供一种改进的流量平台监测方法和系统,通过搭建云计算平台,获取互联网数据流,使用句法分析和语义分析特征向量,给词分量赋予权重值,得到有关评论的质心向量,对质心向量进行报警判断,可以更加容易判断是否合规,极大地提高了防护效率。
附图说明
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京智美互联科技有限公司,未经北京智美互联科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111557425.9/2.html,转载请声明来源钻瓜专利网。