[发明专利]基于网络日志的用户行为刻画与预测方法及系统在审
申请号: | 201910089017.1 | 申请日: | 2019-01-30 |
公开(公告)号: | CN109783460A | 公开(公告)日: | 2019-05-21 |
发明(设计)人: | 康海燕;王紫豪 | 申请(专利权)人: | 北京信息科技大学 |
主分类号: | G06F16/18 | 分类号: | G06F16/18;G06K9/62 |
代理公司: | 北京高沃律师事务所 11569 | 代理人: | 杜阳阳 |
地址: | 100000 北*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 网络日志 性格特征 行为特征向量 用户行为 预测 向量 相似度 刻画 数据支持 防范 | ||
本发明公开了一种基于网络日志的用户行为刻画与预测方法及系统。该方法包括:获取用户的网络日志;根据网络日志提取用户的行为特征向量;获取标准性格特征向量;计算用户的行为特征向量与各标准性格特征向量的相似度;将相似度最高的标准性格特征向量所代表的性格特征确定为用户的性格特征;确定用户的行为特征向量中理科类关键词数量和文科类关键词数量;根据用户的行为特征向量中理科类关键词数量和文科类关键词数量的比值,预测用户的行为。本发明提供的基于网络日志的用户行为刻画与预测方法及系统能够对用户的性格、行为进行预测,进而,为防范危害的发生提供数据支持。
技术领域
本发明涉及一种基于网络日志的用户行为刻画与预测方法及系统。
背景技术
随着网络与信息资源的飞速发展,网络搜索引擎已成为人们获取信息的主要途径,网络搜索日志包含了用户的行为和需求,从网络日志可以判断出一个人的性格,甚至可以预测用户接下来要做的事情。这在安全领域尤其重要,可以根据用户接下来的行为来判断哪些用户可归为危险人群,如黑客经常使用社会工程学的方法利用人的弱点进行攻击。如用户信息泄露,犯罪分子在网络上搜索用户的身份信息、手机号码等实施盗取账号资金的目的。黑客首先进行信息侦探,收集名字、电话号码、身份证号等信息,从而伪装用户以实现对服务器端的欺骗,盗取用户账户。因此,如果安全部门通过分析网络日志,便可判断出危险的人群,甚至可以知道这类人群甚至特定的人接下来要做的事,就可以提前预警,防范危害的发生。
发明内容
本发明的目的是提供一种基于网络日志的用户行为刻画与预测方法及系统,能够对用户的性格进行刻画预测,进而,根据用户性格预测用户的危险性,为防范危害的发生提供数据支持。
为实现上述目的,本发明提供了如下方案:
一种基于网络日志的用户行为刻画与预测方法,包括:
获取用户的网络日志;
根据所述网络日志提取所述用户的行为特征向量,所述行为特征向量为用户网络日志中各领域关键词占关键词总数的比例所构成的向量,所述领域分为自然科学领域和社会科学领域,所述自然科学领域包括军事、科技、体育、旅游和食物,所述社会科学领域包括史政、文艺、社会、娱乐和美容;
获取标准性格特征向量,所述标准性格特征向量为标准性格中各领域关键词占关键词总数的比例所构成的向量,所述领域分为自然科学领域和社会科学领域,所述自然科学领域包括军事、科技、体育、旅游和食物,所述社会科学领域包括史政、文艺、社会、娱乐和美容;
计算所述用户的行为特征向量与各所述标准性格特征向量的相似度;
将相似度最高的标准性格特征向量所代表的性格特征确定为所述用户的性格特征。
可选的,确定所述用户的行为特征向量中理科类关键词数量和文科类关键词数量;
根据用户的行为特征向量中理科类关键词数量和文科类关键词数量的比值,预测所述用户的行为。
可选的,所述计算所述用户的行为特征向量与各所述标准性格特征向量的相似度,具体包括:
计算所述用户的行为特征向量与各所述标准性格特征向量的余弦相似度;
将余弦相似度最小的标准性格特征向量确定为与所述用户行为特征向量相似度最大的标准性格特征向量。
可选的,所述将相似度最高的标准性格特征向量所代表的性格特征确定为所述用户的性格特征,具体包括:
将所述标准性格特征向量划分为积极性格、中级性格和消极性格三种类型;
将与用户行为特征向量相似度最大的标准性格特征向量所属类型确定为所述用户的性格类型。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京信息科技大学,未经北京信息科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910089017.1/2.html,转载请声明来源钻瓜专利网。