[发明专利]地址类型识别方法及装置有效
申请号: | 202110604211.6 | 申请日: | 2021-05-31 |
公开(公告)号: | CN113177784B | 公开(公告)日: | 2022-05-03 |
发明(设计)人: | 张超;王大宇;尹霞 | 申请(专利权)人: | 清华大学 |
主分类号: | G06Q20/06 | 分类号: | G06Q20/06;G06Q20/38;G06Q40/04;G06K9/62;G06F16/27 |
代理公司: | 北京同立钧成知识产权代理有限公司 11205 | 代理人: | 张娜;臧建明 |
地址: | 10008*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 地址 类型 识别 方法 装置 | ||
本申请实施例提供一种地址类型识别方法及装置,该方法包括:将无标签的第一地址数据作为预测模型的输入,以使预测模型输出第一地址数据对应的第一地址类型。根据第一地址数据以及第一地址数据对应的第一地址类型进行扩充处理,得到多个扩充地址数据,各扩充地址数据分别对应各自的扩充地址类型。根据多个扩充地址数据对预测模型进行多轮迭代训练,直至得到输出准确率大于或等于预设准确率的目标模型,其中,目标模型用于输出地址数据对应的地址类型。通过对获得地址类型的第一地址数据进行扩充处理,得到多个扩充地址数据,这扩大了有标签地址数据的数据量。同时,根据多个扩充地址数据对进预测模型进行多轮训练,提高了预测模型的预测准确率。
技术领域
本申请实施例涉及计算机技术,尤其涉及一种地址类型识别方法及装置。
背景技术
区块链资产地址类型能够反映交易的特点以及安全性,因此对区块链资产地址类型进行识别,可以有效监管区块链资产地址的安全性,发现非法行为。
目前,在相关技术中,在对区块链资产的地址类型进行识别时,通常是直接从地址的交易历史记录中提取统计特征,利用基于机器学习的预测模型来预测地址类型,其中,预测模型是根据已知地址类型的地址数据训练得到的。
然而,当已知类型的地址数据的数据量较小时,无法保证预测模型输出的地址类型的正确性,从而导致地址类型识别的准确率较低。
发明内容
本申请实施例提供一种地址类型识别方法及装置,以增加有标签地址数量、提高地址类型预测模型的预测准确率。
第一方面,本申请实施例提供一种地址类型识别方法,包括:
将无标签的第一地址数据作为预测模型的输入,以使所述预测模型输出所述第一地址数据对应的第一地址类型;
根据所述第一地址数据以及所述第一地址数据对应的第一地址类型进行扩充处理,得到多个扩充地址数据,各所述扩充地址数据分别对应各自的扩充地址类型;
根据所述多个扩充地址数据对所述预测模型进行多轮迭代训练,直至得到输出准确率大于或等于预设准确率的目标模型,其中,所述目标模型用于输出地址数据对应的地址类型。
在一种可能的设计中,每轮训练包括如下步骤:
根据所述多个扩充地址数据分别进行特征提取处理,得到各所述扩充地址数据各自对应的特征数据;
根据各所述扩充地址数据各自对应的特征数据对所述预测模型进行训练。
在一种可能的设计中,所述根据各所述扩充地址数据各自对应的特征数据对所述预测模型进行训练,包括:
将各所述扩充地址数据各自对应的特征数据分别输入至所述预测模型中,以使得所述预测模型输出各所述扩充地址数据各自对应的预测地址类型;
根据各所述扩充地址数据各自对应的预测地址类型以及各所述扩充地址数据各自对应的扩充地址类型,确定损失函数值;
根据所述损失函数值,对所述预测模型的参数进行调整。
在一种可能的设计中,所述根据所述第一地址数据以及所述第一地址数据对应的第一地址类型进行扩充处理,得到多个扩充地址数据之前,所述方法还包括:
对所述第一地址数据对应的第一地址类型进行校验,得到校验结果。
在一种可能的设计中,所述对所述第一地址数据对应的第一地址类型进行校验,得到校验结果,包括:
根据所述第一地址数据以及所述第一地址数据对应的第一地址类型进行扩充处理,得到所述第一地址类型对应的多个扩充地址数据;
根据各所述扩充地址数据分别进行特征提取处理,得到各所述扩充地址数据各自对应的特征数据;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于清华大学,未经清华大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110604211.6/2.html,转载请声明来源钻瓜专利网。