[发明专利]通讯录数据处理方法及处理终端在审
申请号: | 201710049818.6 | 申请日: | 2017-01-23 |
公开(公告)号: | CN106850924A | 公开(公告)日: | 2017-06-13 |
发明(设计)人: | 汪伦 | 申请(专利权)人: | 北京奇虎科技有限公司 |
主分类号: | H04M1/2745 | 分类号: | H04M1/2745;H04L29/08 |
代理公司: | 北京市立方律师事务所11330 | 代理人: | 王增鑫 |
地址: | 100088 北京市西城区新*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 通讯录 数据处理 方法 处理 终端 | ||
技术领域
本发明涉及冗余去重技术领域,更具体地,涉及通讯录数据处理方法及处理终端。
背景技术
随着社会信息化不断推进,信息存储应用领域越来越广泛,在过去的5年内全球数字化信息量增长了近10倍。企业数据中心的存储需求量越来越庞大,已从之前的TB级上升到PB级,甚至EB级。目前热门的数据去重(重复数据删除)技术能够在较大程度上降低网络存储系统的存储空间开销,节省网络带宽,降低数据中心的能耗和数据管理成本。目前数据去重服务主要应用于备份、容灾和归档存储系统中。这主要是因为在备份、容灾和归档过程中,服务端数据集内会出现大量的重复冗余数据。随着移动互联网的兴起,定位于移动终端的数据同步、备份和去重合并技术将是下一个关注的焦点。
移动互联网是移动通信和互联网技术结合的产物,是用户通过智能移动终端,采用移动无线通信方式获取互联网服务的新兴业态。移动互联网包含终端、软件和应用三个组成部分。通过移动互联网,人们可以利用手中的手机、平板电脑等移动设备随日、随地访问获取各种网络服务。截止到年底,中国手机网民达到亿;智能手机发货量年将达到亿部。伴随着移动终端存储和运算能力的增加,移动终端的数据也越来越丰富。为了防止数据丢失和实现数据的方便转移,人们已经习惯于将自己移动终端的数据同步到数据备份软件、即时通讯软件、交友平台软件等第三方软件的后台服务器或者备份在本地,在需要的时候随时进行同步和恢复。在数据同步和恢复的过程中,会造成大量重复冗余数据,影响用户体验和终端性能,例如,在移动终端的数据中,通讯录联系人数据是最为典型的一类数据。此类数据的特点是数据的备份和恢复十分频繁,容易产生大量的重复冗余数据;数据和用户的生活和工作息息相关,对于用户具有重要的意义;产生的重复数据难以进行手动的有效处理。
目前,第三方应用常将自己的通讯录写入到手机通讯录里面,在大多数的通讯录联系人和备份同步的过程中,存在以下几种问题:
1、忽略平台的差异性,导致在不同的移动终端相同的联系人数据组织和显示具有差异。
2、同步过程中需要同步的数据和本地端的己有数据之间的关系和差异被忽略。对于这两部分数据,目前仅有简单的追加数据和完全覆盖等处理方式,不能满足用户对于合并数据所要求的比较复杂的条件。这一方面导致了数据的大量重复,另一方面给用户管理数据带来不便。
3、同步过程中或者同步之后,往往无法呈现给用户一个相似联系人数据之间差异的具体的展现界面,使得用户难以对手机中的相似联系人数据实现手动管理、删除和合并。
发明内容
鉴于上述问题,本发明提出了一种通讯录数据处理方法及处理终端,能够准确地合并基于不同数据来源的通讯录。
本发明实施例中提供了一种通讯录数据处理方法,包括:
根据移动终端操作系统提供的系统接口,读取本地联系人数据,生成对应于一个联系人数据的Vcard数据块;
将每一个Vcard数据块按照预设的数据项进行数据分组,利用哈希算法和各个数据分组的权重值计算该Vcard数据块对应的加权哈希值;
相互比较所有的加权哈希值,将哈希值之间海明距离小于第一设定阈值的两个Vcard数据块归并到同一项相似Vcard数据集中;
将各项相似Vcard数据集为合并为一个新的Vcard数据块。
优选地,相互比较所有的加权哈希值的步骤之后,还包括:
将哈希值之间海明距离均大于第二设定阈值的一个Vcard数据块单独作为一个新的Vcard数据块。
优选地,将各项相似Vcard数据集为合并为一个新的Vcard数据块的步骤之后,包括:
响应于用户的去重指令,删除所述相似Vcard数据集中原有的各个Vcard数据块。
优选地,将各项相似Vcard数据集为合并为一个新的Vcard数据块的步骤之后,包括:
响应于用户的分组指令,将联系人按照其中一个预设的数据项进行分组。
优选地,将各项相似Vcard数据集为合并为一个新的Vcard数据块的步骤之后,包括:
响应于用户的分组删除指令,删除相应组别的联系人。
优选地,所述预设的数据项包括:姓名、电话号码、即时消息、邮件、公司、群组、备注、地址、其他当中的至少一个。
优选地,利用哈希算法和各个数据分组的权重值计算该Vcard数据块对应的加权哈希值的步骤,包括:
根据各个数据项的初始权重值设置各个数据分组的初始权重值,其中,所述姓名和/或所述电话号码数据分组的初始权重值高于其他数据分组的初始权重值。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京奇虎科技有限公司,未经北京奇虎科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710049818.6/2.html,转载请声明来源钻瓜专利网。