[发明专利]电子信息数据关联关系分析方法、装置、设备和存储介质有效
申请号: | 202210973829.4 | 申请日: | 2022-08-15 |
公开(公告)号: | CN115238688B | 公开(公告)日: | 2023-08-01 |
发明(设计)人: | 徐新忠;韩冰;彭风华;侯旭东;莫传莹;赵伟;寇睿;李文瑞;欧荣安;李庭轩;程瑞琪;范晨龙;轩翔宇 | 申请(专利权)人: | 广州市刑事科学技术研究所;广州市公安局黄埔区分局;上海歆仁信息科技有限公司 |
主分类号: | G06F40/289 | 分类号: | G06F40/289;G06F16/22;G06F16/31;G06F16/36;G06F40/30 |
代理公司: | 北京至臻永信知识产权代理有限公司 11568 | 代理人: | 杨海涛 |
地址: | 510055 广*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 电子信息 数据 关联 关系 分析 方法 装置 设备 存储 介质 | ||
本发明公开了电子信息数据关联关系分析方法、装置、设备和存储介质,所述方法包括,构建NLP分词模型和NLP语义模型时,包括步骤:对已有的各分析对象的不同类型的电子信息数据,进行逆向解析和/或数据转换,生成对应的明文文本数据;将明文文本数据处理为结构化数据或半结构化数据,并根据预设的多层级的数据分类体系结构存储;根据明文文本数据中的特定数据生成关键信息并设定对应的标注信息;构建包括多个资料库的资料库集;以资料库集中的关键信息和明文文本数据为训练语料进行NLP分词模型的训练和NLP语义模型的训练。本发明可以提高针对风控或内审等场景下电子信息数据的关联、分析和研判的效率和分析结果的准确性和有效性。
技术领域
本发明涉及数据管理领域,特别涉及电子信息数据关联关系分析方法、装置、设备和存储介质。
背景技术
信息化的高速发展造就了越来越多的人借助于互联网工具进行各类社交活动、支付转账、出行指引等各类便利性举措,同时也实时的产生着各类行之有用的互联网应用的电子信息数据;如,手机内安装的各种社交类、支付类、导航类等各式各样的APP。
各类提供风控服务的公司或很多企业在进行内审的安全事件的过程中,在分析对象许可的情况下,会获取到各类相关的有助于进行以上分析的各类互联网应用的电子信息数据,以便判定、刻画该分析对象的征信级别或安全事件的责任判定。
发明人经过研究发现,现有技术中,由于目前各个互联网工具及应用厂商的各自为阵,以及有些应用的本身注册账号注册、通信机制、数据存储受限,各类应用数据存在严重的孤岛特性;这样就使得在针对分析对象数据关联、分析和研判时,容易被干扰数据影响,造成了分析的严重拖延,甚至存在错判、误判;即,现有技术中心针对电子信息数据的关联、分析和研判存在效率低下和分析结果准确性和有效性较差的问题。
公开于该背景技术部分的信息仅仅旨在增加对本发明的总体背景的理解,而不应当被视为承认或以任何形式暗示该信息构成已为本领域一般技术人员所公知的现有技术。
发明内容
本发明的目的在于提高针对电子信息数据的关联、分析和研判的效率和分析结果的准确性和有效性。
本发明提供了一种电子信息数据关联关系分析方法,构建NLP分词模型和NLP语义模型时,包括步骤:
S11、对已有的各分析对象的不同类型的电子信息数据,进行逆向解析和/或数据转换,生成对应的明文文本数据;所述电子信息数据包括一种以上的互联网应用生成的数据;
S12、将所述明文文本数据处理为结构化数据或半结构化数据,并根据预设的多层级的数据分类体系结构存储所述明文文本数据;
S13、根据所述明文文本数据中的特定数据生成关键信息并设定对应的标注信息;所述特定数据为能够在跨应用关联分析中发挥作用的数据;所述关键信息包括:实名信息、虚拟账号信息、地理位置信息、支付信息、手机号信息、车牌信息中的一种或多种个人信息,以及,所述个人信息的属性系信息,以及,所述个人信息间的关联信息;
S14、对存储于特定存储位置的所述关键信息进行二次构建,包括:构建至少包括应用信息资料库、虚拟信息资料库、实名资料库、支付账号资料库和地理位置资料库的资料库集;所述资料库集中的各资料库用于分类存储所述关键信息;
S15、以所述资料库集中的关键信息和明文文本数据为训练语料进行NLP分词模型的训练和NLP语义模型的训练;所述NLP分词模型和所述NLP语义模型用于从所述明文文本数据筛选出各所述关键信息,并根据所述关键信息间的关系属性构建三元组信息:“实体-关系-实体”以及“实体-属性-实体”基本逻辑关系;所述关系属性包括隶属关系、关联类型、关系次数和关联时间中的一种多或多种。
优选的,在本发明中,还包括,根据所述NLP分词模型和所述NLP语义模型构建关系图谱,包括步骤:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于广州市刑事科学技术研究所;广州市公安局黄埔区分局;上海歆仁信息科技有限公司,未经广州市刑事科学技术研究所;广州市公安局黄埔区分局;上海歆仁信息科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210973829.4/2.html,转载请声明来源钻瓜专利网。
- 上一篇:电子设备
- 下一篇:抑制桥梁多模态耦合振动的主被动混合控制系统
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置