[发明专利]基于用户隐私保护的应用程序检测方法及装置有效
申请号: | 202010819239.7 | 申请日: | 2020-08-14 |
公开(公告)号: | CN111680287B | 公开(公告)日: | 2020-11-13 |
发明(设计)人: | 周书恒;黄继堂;祝慧佳 | 申请(专利权)人: | 支付宝(杭州)信息技术有限公司 |
主分类号: | G06F21/51 | 分类号: | G06F21/51;G06F21/62 |
代理公司: | 北京亿腾知识产权代理事务所(普通合伙) 11309 | 代理人: | 陈霁;周良玉 |
地址: | 310000 浙江省杭州市*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 用户 隐私 保护 应用程序 检测 方法 装置 | ||
1.一种基于用户隐私保护的应用程序检测方法,所述方法包括:
从待检测的目标应用程序中,提取出存在用户隐私数据获取需求的若干场景对应的用户界面和隐私数据列表,其中包括第一场景对应的第一用户界面和第一隐私数据列表;
提取所述第一用户界面的内容数据,将所述内容数据转换为相应的第一特征向量;
获取历史库中的多个参考场景分别对应的第一参考特征向量,计算所述第一特征向量与各个所述第一参考特征向量之间的第一相似度,所述第一相似度表征场景之间的相似度;
当所述第一特征向量与某个第一参考特征向量之间的所述第一相似度超过第一预定阈值时,获取该某个第一参考特征向量对应的参考场景下的参考隐私数据列表;
计算所述第一隐私数据列表与所述参考隐私数据列表之间的第二相似度;
基于所述第二相似度是否低于第二预定阈值,或者基于所述第一场景对应的异常值是否超过第四预定阈值,判别所述第一场景是否为异常场景;所述第一场景的异常值至少基于所述第二相似度确定。
2.根据权利要求1所述的方法,其中,所述第一用户界面的内容数据包括文本数据和/或图片数据;
将所述内容数据转换为相应的第一特征向量,包括:
对于文本数据,通过预先训练的第一文本转换模型,转换为文本特征向量;所述第一文本转换模型包括doc2vec模型或BERT模型;
对于图片数据,通过预先训练的神经网络模型,转换为图片特征向量;
基于所述文本特征向量和/或所述图片特征向量,获得第一特征向量。
3.根据权利要求1所述的方法,其中,基于所述第一场景对应的异常值是否超过第四预定阈值,判别所述第一场景是否为异常场景之前,还包括:
基于预先训练的第二转换模型,确定所述目标应用程序对应的第二特征向量;
获取该某个第一参考特征向量对应的参考应用程序的第二参考特征向量;
计算所述第二特征向量与所述第二参考特征向量之间的第三相似度。
4.根据权利要求3所述的方法,其中,基于所述第一场景对应的异常值是否超过第四预定阈值,判别所述第一场景是否为异常场景,包括:
基于所述第一相似度、所述第二相似度和所述第三相似度,计算相应的第一隐私数据列表对应的第一场景的异常值;
若所述异常值超过第四预定阈值,则判定所述第一场景为异常场景。
5.根据权利要求3所述的方法,其中,基于预先训练的第二转换模型,确定所述目标应用程序对应的第二特征向量之前,还包括:
获取多个用户对多个应用程序的访问序列;
将所述访问序列作为训练语料,训练所述第二转换模型,所述第二转换模型用于输出各个应用程序对应的第二特征向量,其中,
所述第二转换模型为word2vec模型。
6.根据权利要求5所述的方法,其中,所述访问序列从用户访问会话数据中获得。
7.根据权利要求1所述的方法,其中,基于所述第二相似度是否低于所述第二预定阈值,判别所述第一场景是否为异常场景,包括:
当所述第二相似度低于第二预定阈值时,将相应的第一隐私数据列表对应的场景判定为异常场景。
8.根据权利要求1-7任一项所述的方法,其中,判别所述第一场景是否为异常场景之后,还包括:
针对多个异常场景对应的第一特征向量,进行聚类;
提供聚类结果,用于分析各个类簇相应的合法隐私数据列表。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于支付宝(杭州)信息技术有限公司,未经支付宝(杭州)信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010819239.7/1.html,转载请声明来源钻瓜专利网。