[发明专利]一种信息处理方法、装置及计算机可读存储介质有效
申请号: | 201910086995.0 | 申请日: | 2019-01-29 |
公开(公告)号: | CN109886318B | 公开(公告)日: | 2021-04-30 |
发明(设计)人: | 李迪民 | 申请(专利权)人: | 北京明略软件系统有限公司 |
主分类号: | G06K9/62 | 分类号: | G06K9/62 |
代理公司: | 北京安信方达知识产权代理有限公司 11262 | 代理人: | 王康;栗若木 |
地址: | 102218 北京市昌平区东小*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 信息处理 方法 装置 计算机 可读 存储 介质 | ||
本发明实施例公开了一种信息处理方法、装置及存储介质,包括:服务器将事件实体按照相同的事件发生日期和相同的事件内容进行分类,得到若干个第一分类集;在每个第一分类集中分别获取所有由两个事件实体组成且符合预设单事件实体关联规则的事件实体对;获取包含的两个事件实体存在于所有第一分类集中的事件实体对,作为待选择事件实体对;在待选择事件实体对中获取符合预设多事件实体关联规则的事件实体对作为输出信息。从本发明实施例提供的技术方案可见,由于将事件实体按照事件发生日期和事件内容进行分类,进而根据获得的分类集进行符合预设规则的事件实体对筛选,因此节省了发掘事件实体之间关系所耗费的时间成本,提高了发掘效率。
技术领域
本发明实施例涉及计算机技术领域,尤其涉及一种信息处理方法、装置及计算机可读存储介质。
背景技术
信息处理是指处理海量信息以期发掘有价值信息的过程。在公安领域建立的大数据平台中存在着多种事件信息文件,例如有网吧监控信息文件、住宿管理信息文件、卡口监控信息文件、火车出行信息文件、客运出行信息文件、飞机出行信息文件、出入境管理信息文件等,上述事件数据源记录的都是事件实体(即个人)的活动轨迹数据,信息处理就是在海量信息中找到事件实体与事件实体(即人与人)之间的潜在关系。
相关技术中,在进行信息处理的过程中,往往会将所有信息记录依次进行两两比对以期找到事件实体之间的潜在关系。
然而,由于这种方法需要基于两两信息记录依次进行比对发掘,因此十分耗费时间成本,造成事件实体之间关系的发掘效率低下。
发明内容
为了解决上述技术问题,本发明实施例提供一种信息处理方法、装置及计算机可读存储介质,能够节省时间成本,提高发掘效率。
为了达到本发明实施例目的,本发明实施例提供了一种信息处理方法,包括:
服务器将事件实体按照相同的事件发生日期和相同的事件内容进行分类,得到若干个第一分类集;
在每个第一分类集中分别获取所有由两个事件实体组成且符合预设单事件实体关联规则的事件实体对;
获取所包含的两个事件实体同时存在于所有第一分类集中的事件实体对,作为待选择事件实体对;
在所述待选择事件实体对中获取符合预设多事件实体关联规则的事件实体对作为输出信息。
所述将事件实体按照相同的事件发生日期和相同的事件内容进行分类之前,还包括:
根据获得的事件实体与事件信息的对应关系获取事件信息中的事件发生日期和事件内容。
所述根据获得的事件实体与事件信息的对应关系获取事件信息中的事件发生日期和事件内容之前,还包括:
开启个数与预设分片数相同的线程;
控制每个线程读取相应的事件实体分片,得到事件实体;
根据获得的事件实体读取所述事件实体与事件信息的对应关系。
所述开启个数与预设分片数相同的线程之前,还包括:
读取事件信息文件,得到事件信息记录;
根据获得的事件信息记录获取并存储事件实体与事件信息的对应关系;
采用预设哈希函数对所述事件实体与事件信息的对应关系中的事件实体依次进行哈希运算,得到哈希值;
对获得的哈希值与所述预设分片数依次进行取模运算,得到结果值;
存储所述事件实体至与根据该事件实体获得的结果值对应的分片,得到事件实体分片。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京明略软件系统有限公司,未经北京明略软件系统有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910086995.0/2.html,转载请声明来源钻瓜专利网。