[发明专利]一种基于综合分段的用户口令建模与强度评估方法有效

专利信息
申请号: 202110019967.4 申请日: 2021-01-07
公开(公告)号: CN112632526B 公开(公告)日: 2022-04-12
发明(设计)人: 韩伟力;王传旺;徐铭;张俊杰 申请(专利权)人: 复旦大学
主分类号: G06F21/46 分类号: G06F21/46;G06F16/31;G06F40/216;G06F40/242
代理公司: 上海正旦专利代理有限公司 31200 代理人: 陆飞;陆尤
地址: 200433 *** 国省代码: 上海;31
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 基于 综合 分段 用户 口令 建模 强度 评估 方法
【权利要求书】:

1.一种基于综合分段的口令建模与强度评估方法,其特征在于,包括细化口令中的段的具体类别,依据对数据集中段的识别结果,采用穷举算法选取单条用户口令所符合的所有口令结构并赋予概率值,所有概率值中的最大值越高,表明用户口令的强度越低;其中,用户口令中段的类别包含如下5种:

(1)键盘模式,即在键盘设备上按键相邻的字符串、组成平行线、垂直线的字符串;

(2)网络语,即形似字符替换与音似字符替换,使用两类或以上字符,长度至少为4;

(3)简写,即由多类字符组成的缩写或常用表示,长度至多为4;

(4)基本词,即由连续同类字符组成的字符串;

(5)混合词,即从口令的最大概率的拓扑排序序列中提取出的基本词,亦称混合词;

其中键盘模式、网络语、简写、基本词通过识别连续段获取,混合词通过识别不连续段获取;

口令建模与强度评估方法的具体步骤如下:

步骤一、识别用户口令中的连续段

对用户口令集中的每一条口令,将该口令拆分成多个子字符串,每个子字符串作为该口令的一段,都是不可再次拆分的;

其中,用户口令输入格式如下:

(1)每一行表示一条用户口令;

(2)对于每一条用户口令,只包含大小写字母、数字、特殊符号,可打印ASCII字符和空白字符除外;

步骤二、识别用户口令中的不连续段

将一条只包含基本词的用户口令看作有向无环图,根据数据集中用户口令结构,穷举该图的拓扑排序序列,并为各序列赋予概率值,数据集口令结构中不存在的拓扑排序序列设置其概率为0;选取所有序列中概率最大的一种,根据最大概率拓扑排序序列识别基本词,识别出的基本词即是混合词;

步骤三、评估用户口令强度

对于单条用户口令,根据步骤二得到的口令结构分布与段实例分布,得到多种口令结构;使用字典树用于数据集口令结构的存储与查询,穷举该用户口令的口令结构并计算相应的概率值,选择最大概率值用于口令强度评估;

对于用户口令的建模与强度评估,作如下设定:

(1)用户口令的建模与强度评估与口令复用有直接关系,口令复用现象越普遍,用户口令建模越准确、口令强度越低;

(2)单条用户口令可能符合多种口令结构,对应多种概率;用户口令的强度与最大概率有直接关系,最大概率越高,口令强度越低;

(3)可以使用蒙特卡罗方法将口令概率值转换为口令强度值,即破解该口令需要枚举的口令个数;

步骤一中,所述用户口令中连续段的识别,具体过程如下:

(1)对用户口令数据集中的每一条口令,按最长匹配识别并标记口令中的键盘模式,键盘模式分为:连续,即相邻字符在键盘上的按键相邻,平行,即字符映射到键盘上的按键后呈平行线,垂直,即字符映射到键盘上的按键后垂直且连续;

(2)统计用户口令数据集中字母字符串的频次;

(3)用户口令数据集中每一条长度大于4的口令通过去网络语化;若复原得到的字母字符串的频次至少为5,则识别该口令为网络语;使用字典树存储所有网络语;对标记键盘模式后的每一条口令,使用字典树和最长匹配识别并标记网络语;

(4)对标记键盘模式和网络语后的每一条口令,使用最长匹配识别并标记简写;简写是预定义的,包含如下内容:“:p”,“*0*”,“#1”,“No.1”,“No.”,“i3”,“3”,“Mr.”,“Ms.”,“Mz.”,“St.”,“Dr.”;

(5)统计字母字符串、数字字符串、特殊符号字符串的概率分布;对每一条口令中未标记的字符串,将该字符串拆分成一个或多个子字符串,使得所有基本词的概率乘积与基本词个数的比值最大;

(6)根据口令结构的频次分布计算口令结构的概率分布;根据段的长度与类别,统计各长度、类别下段的频次分布并计算其概率分布;使用字典树存储口令结构,字典树的每一个结点代表一个段;

步骤二中所述识别用户口令中的不连续段,具体过程如下:

(1)将只含有基本词、且基本词个数大于字符种类数的用户口令看作有向无环图,大小写字母看作同类字符:字符ai有指向字符aj的边,i表示口令中第i个字符,j是大于i且保证ai与aj属于同类字符的最小整数值,若不存在这样的j,则ai没有指向其它字符的边;

(2)对该无环图进行拓扑排序,对每一种拓扑排序序列赋予一个概率,选取概率最大的一种序列,作为最大概率拓扑排序序列;赋予序列概率的方式为,序列中所有段的概率的乘积与序列中段的数目的比例;

(3)统计最大概率拓扑排序序列的基本词,识别为混合词,调整口令结构和段的概率分布。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于复旦大学,未经复旦大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202110019967.4/1.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top