[发明专利]大数据量动态模糊查控算法模型无效
申请号: | 200610113271.3 | 申请日: | 2006-09-21 |
公开(公告)号: | CN1932815A | 公开(公告)日: | 2007-03-21 |
发明(设计)人: | 邱旭华;陈桂芳 | 申请(专利权)人: | 公安部第一研究所 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 北京中海智圣知识产权代理有限公司 | 代理人: | 曾永珠 |
地址: | 100044*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开了一种大数据量动态模糊查控算法模型,主要对个人及证件信息进行动态模糊查控。其方法是首先对布控人员信息进行信息规范,规范方式即对信息按照新的拆分规则进行拆分,去除噪声信息;然后对待检查人员信息进行相同规则拆分后与布控人员信息按新的匹配规则进行匹配。该算法是基于“空间换时间”的原理,提供了新型的拆分规则和匹配规则,对于大数据量业务的处理,有效的提高了查控效率,降低了漏报率和误报率。同时还可以根据需要动态设定参数,具有很大的灵活性。 | ||
搜索关键词: | 数据量 动态 模糊 算法 模型 | ||
【主权项】:
1.一种大数据量动态模糊查控算法模型,其特征在于:按照拆分规则对布控人员信息和待查人员信息分别进行拆分,去除噪声数据,对于身份证号和通行证号采用完全匹配,对于姓名和生日按照匹配规则与布控人员信息进行匹配;姓名拆分规则1)将所有字母进行大写转换;2)去除噪声数据,将非汉字且非大写字母的字符作为分隔符,进行拆分;3)对于汉字采取根据系统设定的拆分个数自右到左进行拆分;4)对于英文可采用两种拆分方式A.根据系统设定的保留字母个数进行头尾拆分;B.对英文姓名进行字母的字典排序后再根据系统设定的模数进行拆分;生日拆分规则1)去除噪声数据,即去除所有非数字字符;2)将数据中的年月日表示为YYMMDD格式,其中,YY代表年份的后两位,MM表示月份,DD表示日期;3)将YYMMDD的每两位进行拆分得到YY、MM、DD,并在拆分出的数据前面分别加上对应的标志符号‘y’、‘m’、‘d’;身份证号和通行证号拆分规则是对字母进行大写转换后去除其中的非数字且非大写字母的字符;所述匹配规则是指实际情况动态设定报警阈值和姓名、生日的权重,根据拆分结果计算出相似度,与报警阈值进行比较。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于公安部第一研究所,未经公安部第一研究所许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/200610113271.3/,转载请声明来源钻瓜专利网。
- 上一篇:一种灵芝干浸膏的制备方法
- 下一篇:被动发光显示终端图像对比度控制方法