[发明专利]一种数据处理方法、装置及设备有效
| 申请号: | 202310152553.8 | 申请日: | 2023-02-09 |
| 公开(公告)号: | CN115827935B | 公开(公告)日: | 2023-05-23 |
| 发明(设计)人: | 李怀松;黄涛;张天翼;贾娟;林谢雄;钱思涵 | 申请(专利权)人: | 支付宝(杭州)信息技术有限公司 |
| 主分类号: | G06F16/904 | 分类号: | G06F16/904;G06F16/901;G06F16/25;G06F16/26;G06F40/12;G06N3/0455;G06N3/0442;G06N3/0464;G06Q20/40;G06Q50/26 |
| 代理公司: | 北京国昊天诚知识产权代理有限公司 11315 | 代理人: | 朱文杰 |
| 地址: | 310000 浙江省杭州市*** | 国省代码: | 浙江;33 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 数据处理 方法 装置 设备 | ||
本说明书实施例公开了一种数据处理方法、装置及设备,该方法包括:获取目标结构化数据,基于目标结构化数据,将目标结构化数据转换为图结构数据,将图结构数据划分为多个不同的子图数据,并基于图结构数据、多个不同的子图数据和对目标结构化数据进行预设的逻辑操作的数据,确定多个不同的子图数据中与预设的逻辑操作的数据相匹配的目标子图数据,预设的逻辑操作的复杂程度高于预设阈值;将目标结构化数据以序列化的方式输入到编码器中,得到目标结构化数据对应的编码序列,并基于编码序列、目标结构化数据对应的嵌入特征数据和目标子图数据,通过解码器生成目标结构化数据对应的群组描述文本,增加了群组成员逻辑操作,提升了文本生成的质量。
技术领域
本文件涉及计算机技术领域,尤其涉及一种数据处理方法、装置及设备。
背景技术
对存在指定风险的账户群组进行识别和上报,是国内外监管都重点要求的部分,在将存在指定风险的账户群组上报给指定的监管机构时,通常需要提供描述该账户群组中的账户对应的用户行为(例如如何进行欺诈等)的群组描述文本。当前,一般是基于人工或设定规则的方式构建群组描述文本,但是,上述方式得到的群组描述文本中无法覆盖所有的用户行为,而通过一般的深度学习模型生成群组描述文本的方式,虽然在客观描述和数值对比上有一定的优势效果,但是在账户群组的成员逻辑关系的判断上存在不足,为此,需要提供一种能够学习账户群组内部的逻辑推理,从而提升群组描述文本生成的效率和质量的技术方案。
发明内容
本说明书实施例的目的是提供一种能够学习账户群组内部的逻辑推理,从而提升群组描述文本生成的效率和质量的技术方案。
为了实现上述技术方案,本说明书实施例是这样实现的:
本说明书实施例提供的一种数据处理方法,所述方法包括:获取目标结构化数据,所述目标结构化数据包括存在预设关联关系的账户群组中的账户标识和相应的预设特征的特征值。基于所述目标结构化数据,将所述目标结构化数据转换为图结构数据,所述图结构数据中包括节点和边,所述节点和所述边是由所述目标结构化数据中的信息构建。将所述图结构数据划分为多个不同的子图数据,并基于所述图结构数据、所述多个不同的子图数据和对所述目标结构化数据进行预设的逻辑操作的数据,确定所述多个不同的子图数据中与所述预设的逻辑操作的数据相匹配的目标子图数据,所述预设的逻辑操作的复杂程度高于预设阈值。将所述目标结构化数据以序列化的方式输入到编码器中,得到所述目标结构化数据对应的编码序列,并基于所述编码序列、所述目标结构化数据对应的嵌入特征数据和所述目标子图数据,通过与所述编码器相对应的解码器生成所述目标结构化数据对应的群组描述文本,所述群组描述文本用于描述所述账户群组中的关联账户的相关信息。
本说明书实施例提供的一种数据处理装置,所述装置包括:数据获取模块,获取目标结构化数据,所述目标结构化数据包括存在预设关联关系的账户群组中的账户标识和相应的预设特征的特征值。转换模块,基于所述目标结构化数据,将所述目标结构化数据转换为图结构数据,所述图结构数据中包括节点和边,所述节点和所述边是由所述目标结构化数据中的信息构建。处理模块,将所述图结构数据划分为多个不同的子图数据,并基于所述图结构数据、所述多个不同的子图数据和对所述目标结构化数据进行预设的逻辑操作的数据,确定所述多个不同的子图数据中与所述预设的逻辑操作的数据相匹配的目标子图数据,所述预设的逻辑操作的复杂程度高于预设阈值。文本生成模块,将所述目标结构化数据以序列化的方式输入到编码器中,得到所述目标结构化数据对应的编码序列,并基于所述编码序列、所述目标结构化数据对应的嵌入特征数据和所述目标子图数据,通过与所述编码器相对应的解码器生成所述目标结构化数据对应的群组描述文本,所述群组描述文本用于描述所述账户群组中的关联账户的相关信息。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于支付宝(杭州)信息技术有限公司,未经支付宝(杭州)信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202310152553.8/2.html,转载请声明来源钻瓜专利网。





