[发明专利]一种区块链数字货币的实体身份类型推测方法及系统在审
申请号: | 202210122317.7 | 申请日: | 2022-02-09 |
公开(公告)号: | CN114445085A | 公开(公告)日: | 2022-05-06 |
发明(设计)人: | 朱娜斐;何琳;何泾沙;常瑞天;王兴振;何家锦 | 申请(专利权)人: | 北京工业大学 |
主分类号: | G06Q20/40 | 分类号: | G06Q20/40;G06K9/62;G06Q20/06 |
代理公司: | 北京汇信合知识产权代理有限公司 11335 | 代理人: | 孙民兴 |
地址: | 100124 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 区块 数字 货币 实体 身份 类型 推测 方法 系统 | ||
1.一种区块链数字货币的实体身份类型推测方法,其特征在于,包括:
根据区块链数字货币的原始交易数据集进行特征提取、降维,得到融合特征数据集,得到融合特征数据集;
将所述融合特征数据集分为训练样本和验证样本,根据所述训练样本训练虚拟地址账户身份类型识别模型,获得分类器;
通过所述分类器对所述验证样本进行虚拟地址账户身份类型识别,获得虚拟地址账户身份类型表;
根据所述虚拟地址账户身份类型表进行聚类,获得多个实体,统计各所述实体的所有虚拟地址账户及对应的身份类型;
根据所述实体每种所述身份类型的虚拟地址账户数量占比,确定该实体的身份类型。
2.根据权利要求1所述的实体身份类型推测方法,其特征在于,所述根据区块链数字货币的原始交易数据集进行特征提取、降维,得到融合特征数据集;包括:
根据区块链数字货币的原始交易数据集进行特征提取获得初始特征数据集;
对所述初始特征数据集进行特征筛选和降维处理,得到融合特征数据集。
3.根据权利要求2所述的实体身份类型推测方法,其特征在于:
将区块链数字货币的所述原始交易数据集解析为地址数据集和交易数据集;
将地址数据集和交易数据集中的数据进行1对n映射,并输入Feature-tools特征生成工具,经聚合及转换操作自动化计算初始特征数据集。
4.根据权利要求2所述的实体身份类型推测方法,其特征在于:
基于信息增益计算所述初始特征数据集中每个特征的特征贡献值,筛选所述特征贡献值高于预设贡献度阈值的特征,得到新特征数据集;
对所述新特征数据集进行PCA降维处理,获得融合特征数据集。
5.根据权利要求1所述的实体身份类型推测方法,其特征在于,根据所述训练样本训练虚拟地址账户身份类型识别模型,获得分类器,包括:
将所述训练样本分为训练数据和测试数据;
通过训练数据对所述虚拟地址账户身份类型识别模型进行训练,通过测试数据对训练得到的所述虚拟地址账户身份类型识别模型进行效果检验;
循环进行训练、检验过程使所述虚拟地址账户身份类型识别模型迭代优化,获得最优模型作为分类器。
6.根据权利要求1所述的实体身份类型推测方法,其特征在于:
所述分类器针对验证样本中每组数据依次判断是否属于类型1至n;
过程中,若判断为是,则该组数据属于对应类型;
若均判断为否,则该组数据为其它类型。
7.根据权利要求1所述的实体身份类型推测方法,其特征在于:采用启发式聚类方法对所述虚拟地址账户身份类型表中的虚拟地址账户进行聚类,获得多个实体。
8.根据权利要求1所述的实体身份类型推测方法,其特征在于,所述根据所述实体每种所述身份类型的虚拟地址账户数量占比,确定该实体的身份类型;包括:
分别计算实体各所述身份类型的虚拟地址账户数量占比,获得占比最大的所述身份类型及对应的比值;
判断该所述比值是否大于0.5,若判断为是,则推测该实体的身份类型为该占比最大的所述身份类型,并将该实体的所有所述虚拟地址账户均确定为该占比最大的所述身份类型。
9.根据权利要求8所述的实体身份类型推测方法,其特征在于:若判断为否,则认为该实体的所述虚拟地址账户身份类型无法推测。
10.一种实现如权利要求1~9任一项所述的实体身份类型推测方法的系统,其特征在于,包括:数据准备模块、模型训练模块、虚拟地址账户身份类型初步推测模块、启发式纠错推测模块;
所述数据准备模块,用于:
根据区块链数字货币的原始交易数据集进行特征提取、降维,得到融合特征数据集,得到融合特征数据集;
所述模型训练模块,用于:
将所述融合特征数据集分为训练样本和验证样本,根据所述训练样本训练虚拟地址账户身份类型识别模型,获得分类器;
所述虚拟地址账户身份类型初步推测模块,用于:
通过所述分类器对所述验证样本进行虚拟地址账户身份类型识别,获得虚拟地址账户身份类型表;
所述启发式纠错推测模块,用于:
根据所述虚拟地址账户身份类型表进行聚类,获得多个实体,统计各所述实体的所有虚拟地址账户及对应的身份类型;
根据所述实体每种所述身份类型的虚拟地址账户数量占比,确定该实体的身份类型。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京工业大学,未经北京工业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210122317.7/1.html,转载请声明来源钻瓜专利网。