[发明专利]辅助识别爬虫的、爬虫识别方法、装置及电子设备有效
申请号: | 201911387124.9 | 申请日: | 2019-12-25 |
公开(公告)号: | CN111143654B | 公开(公告)日: | 2023-06-16 |
发明(设计)人: | 宗志远 | 申请(专利权)人: | 支付宝(杭州)信息技术有限公司 |
主分类号: | G06F16/951 | 分类号: | G06F16/951;G06F16/955;G06F40/289;G06F40/284 |
代理公司: | 北京国昊天诚知识产权代理有限公司 11315 | 代理人: | 许振新 |
地址: | 310000 浙江省杭州市*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本说明书实施例公开了一种辅助识别爬虫的、爬虫识别方法、装置和电子设备,其中,爬虫识别方法可以确定通过目标会话访问目标应用的网络资源地址的目标访问序列;然后基于预先训练得到的词向量字典,确定所述目标访问序列的特征向量,该词向量字典是以网络资源地址为分词,以多个访问序列为语料进行训练得到的;基于目标访问序列的特征向量和目标模型,确定目标会话的爬虫评估参数,该目标模型是以所述多个访问序列中爬虫用户对应的访问序列的特征向量为黑样本,以所述多个访问序列中非爬虫用户对应的访问序列的特征向量为白样本训练得到的;最后基于爬虫评估参数,确定目标会话中是否存在爬虫。本说明书实施例采用机器学习的方式识别爬虫。 | ||
搜索关键词: | 辅助 识别 爬虫 方法 装置 电子设备 | ||
【主权项】:
暂无信息
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于支付宝(杭州)信息技术有限公司,未经支付宝(杭州)信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201911387124.9/,转载请声明来源钻瓜专利网。
- 上一篇:一种可穿戴式癫痫监测设备
- 下一篇:一种基于知识图谱的大数据显示方法