[发明专利]一种数据的聚类方法和电子设备有效

专利信息
申请号: 201911030402.5 申请日: 2019-10-28
公开(公告)号: CN110765329B 公开(公告)日: 2022-09-23
发明(设计)人: 张首斌;薛智慧;潘季明 申请(专利权)人: 北京天融信网络安全技术有限公司;北京天融信科技有限公司;北京天融信软件有限公司
主分类号: G06F16/906 分类号: G06F16/906;G06K9/62
代理公司: 北京金信知识产权代理有限公司 11225 代理人: 韩岳松
地址: 100085 北京*** 国省代码: 北京;11
权利要求书: 查看更多 说明书: 查看更多
摘要: 本申请提供了一种数据的聚类方法及电子设备,该方法包括:获取目标数据,对所述目标数据进行分类处理,生成包含多类数据的数据群;基于聚类特征对所述数据群进行第一聚类操作,生成具有不同聚类特征的多个数据集;基于所述数据集的属性特征对所述数据集进行第二聚类操作,生成具有不同属性特征的多个数据子集。本申请所提供的方法能够全面深入地获取目标数据,快速地对数据群进行初步划分,然后基于细致划分数据的目的,对数据集进行进一步的细致划分,精确地划分生成了数据子集,直观地反映出数据的分布和状况。
搜索关键词: 一种 数据 方法 电子设备
【主权项】:
1.一种数据的聚类方法,所述方法包括:/n获取目标数据,对所述目标数据进行分类处理,生成包含多类数据的数据群;/n基于聚类特征对所述数据群进行第一聚类操作,生成具有不同聚类特征的多个数据集;/n基于所述数据集的属性特征对所述数据集进行第二聚类操作,生成具有不同属性特征的多个数据子集。/n
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京天融信网络安全技术有限公司;北京天融信科技有限公司;北京天融信软件有限公司,未经北京天融信网络安全技术有限公司;北京天融信科技有限公司;北京天融信软件有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/patent/201911030402.5/,转载请声明来源钻瓜专利网。

同类专利
  • 一种基于跨模态模型训练的AI数据分析算法-202310949201.5
  • 刘跃峰 - 苏州英弗越科技有限公司
  • 2023-07-31 - 2023-10-27 - G06F16/906
  • 本发明属于数据分析技术领域,具体涉及一种基于跨模态模型训练的AI数据分析算法,包括:构建历史数据的数据库,对历史数据进行分类,根据历史数据中特征所占的比重将历史数据进行分类;根据数据库获取特征向量;通过特征向量对跨模态模型进行训练;根据训练后的跨模态模型对AI数据进行分析;实现了模型的训练,通过训练后的模型可以使得AI数据的分析更加的精确和精准,便于后续的项目准确顺利的开展,避免分析结果的错误导致后续项目无法进行。
  • 档案数据处理方法及装置-202310967374.X
  • 洪泽慧;李博;尚琪林 - 中国工商银行股份有限公司
  • 2023-08-02 - 2023-10-27 - G06F16/906
  • 本说明书涉及人工智能技术领域,具体地公开了一种档案数据处理方法及装置,其中,该方法包括:获取目标档案数据;将所述目标档案数据划分为结构化数据和非结构化数据;分别对所述结构化数据和所述非结构化数据进行预处理,得到预处理后的结构化数据和非结构化数据;将所述预处理后的结构化数据和非结构化数据进行合并,得到预处理后的目标档案数据;将所述预处理后的目标档案数据输入目标分类模型中,得到所述目标档案数据与历史档案数据之间的关联关系数据。通过上述方案,可以得到档案数据之间的关联关系,从而能够建立档案数据间的隐形关联性。
  • 聚类集合的处理方法、装置、计算机可读介质及电子设备-202110261725.6
  • 李强 - 腾讯科技(深圳)有限公司
  • 2021-03-10 - 2023-10-27 - G06F16/906
  • 本申请的实施例提供了一种聚类集合的处理方法、装置、计算机可读介质及电子设备。方法包括:获取待处理的多个聚类集合,各个聚类集合中包含有多个聚类信息;根据所述各个聚类集合的最新更新时间,从所述多个聚类集合中确定所述最新更新时间处于预定时间点之后的第一聚类集合;根据所述多个聚类集合中除所述第一聚类集合之外的其它聚类集合所包含的聚类信息含量,筛选出所包含的聚类信息含量大于或等于设定阈值的聚类集合,得到筛选出的第二聚类集合;根据所述第一聚类集合以及所述第二聚类集合,生成针对所述多个聚类集合的处理结果。本申请实施例的技术方案能够有效解决增量聚类算法中由于聚类集合增多而导致的算法性能下降的问题。
  • 一种形成样本类簇的方法及装置-201910205005.0
  • 曹绍升;张志强 - 创新先进技术有限公司
  • 2019-03-18 - 2023-10-27 - G06F16/906
  • 本说明书实施例提供一种形成样本类簇的方法及装置。所述方法包括:首先,获取关系网络图中多个样本的特征信息和样本间连接关系;并基于所述多个样本中各个样本的特征信息,将所述多个样本划分为多个子集;接着,对所述多个子集中的样本分别进行聚类,得到N个聚群;N为正整数;接着,确定各个聚群的内聚度;确定聚群间耦合度;并根据该聚群间耦合度,以及聚群内聚度,确定聚群间耦合系数;然后,基于所述N个聚群中各个两两聚群的聚群间耦合系数,形成包括所述N个聚群作为节点的网络结构;基于所述网络结构的连通性,对所述N个聚群中的至少两个聚群进行合并,得到样本类簇。
  • 一种医疗健康数据管理平台操作方法及系统-202311191114.4
  • 陈强炬;刘灿;戴红丽;郭丽;毛少秋;陈娇娇 - 江苏海王健康生物科技有限公司
  • 2023-09-15 - 2023-10-24 - G06F16/906
  • 本发明涉及数据管理技术领域,公开了一种医疗健康数据管理平台操作方法及系统。本发明通过各类医疗设备实时的对用户数据进行采集,并实时将采集到的数据通过物联网平台的处理上传到医疗健康数据管理平台;同时基于采集到的数据进行分类,将不同的数据保存至不同的数据库中,从而实现对医疗健康数据的管理。用户和医护人员可通过登录医疗健康数据管理平台并可基于每个用户和设备唯一的标识,实现对该设备或用户数据的查询访问。本发明通过在每条传输数据的末尾增加CRC校验码保证了医疗健康数据的可靠性,保证了系统的安全性。
  • 多属性图异常检测方法、装置、设备和介质-202310891774.7
  • 谢菁;张强;汪宇 - 中国联合网络通信集团有限公司;中讯邮电咨询设计院有限公司
  • 2023-07-19 - 2023-10-20 - G06F16/906
  • 本申请提供一种多属性图异常检测方法、装置、设备和介质。该方法包括:获取对应图属性相同的图节点的相似度,并根据所述相似度获取各个图属性的有权图,其中,每个图属性对应一个有权图;分别对各个有权图进行聚类,获得各个图属性对应图节点的分类,其中,每个所述图属性对应至少一个分类;对各个所述分类进行评分,获得所述图节点的评分;根据所述图节点对应的预设图属性权重和所述图节点的评分,获取每个所述图节点的异常系数,得到异常检测结果。本申请的方法融合了图的多个属性,获取到更具参考价值的异常检测结果。
  • 一种基于相关性约简的图节点分类方法、系统及设备-202310894691.3
  • 徐慧英;朱信忠;陈宇杭;张鑫煜 - 浙江师范大学
  • 2023-07-20 - 2023-10-20 - G06F16/906
  • 本发明公开了一种基于相关性约简的图节点分类方法、系统及设备,属于数据挖掘、图表示学习领域。该方法包括:导入数据集获得输入图,通过数据增强将输入图转化为两个视图;将得到的两个视图输入到待训练的GNN编码器中,得到节点表征;基于相关性约简原则,融合均方误差、正则化得到损失函数,并使用节点表征计算损失值;基于损失值,通过反向传播更新参数,训练得到具有最佳参数的GNN编码器;通过具有最佳参数的GNN编码器生成新的节点表征,并通过新的节点表征进行图节点分类,构建最佳模型。本发明能够防止图节点分类中现有图神经网络存在的表示崩溃现象,提升保留图数据的能力,有效提高图节点分类效率及准确率。
  • 数据类型的分类方法、装置、计算机设备及存储介质-202310901502.0
  • 雷皓鑫;方浩 - 济南浪潮数据技术有限公司
  • 2023-07-21 - 2023-10-20 - G06F16/906
  • 本公开涉及数据类型的分类方法、装置、计算机设备及存储介质,包括:获取待访问数据集合,确定待访问数据集合内的每个待访问数据的访问次数;获取访问次数相同的第一待访问数据并统计第一待访问数据的目标个数;根据目标个数,确定待重新排序的待访问数据子集,并将重新排序后的待访问数据子集加入待访问数据集合,得到访问历史队列;根据重新排序次数,确定访问历史队列中的第一频次访问队列和第二频次访问队列;根据第一频次访问队列、第二频次访问队列对访问历史队列内的所有待访问数据进行重新排序,将位于队列第一预设位置处的待访问数据作为第一类型数据,将第一预设位置之外的待访问数据作为第二类型数据。
  • 一种面向变分布数据流的在线分类方法-202011455187.6
  • 尹宏鹏;周瀚;廖城霖;钟锦涛 - 重庆大学
  • 2020-12-10 - 2023-10-20 - G06F16/906
  • 本发明涉及一种面向变分布数据流的在线分类方法,属于计算机技术领域。该方法包括以下步骤:步骤一:离线训练阶段;步骤二:在线训练阶段;步骤三:在线测试阶段;现有的面向数据流的在线分类算法没有考虑到实际动态数据流环境中分布变化现象。而本发明的公开的在线分类方法,可以自适应学习数据流分布的变化,以应对不断演变的动态环境,具有更重要的实用价值。
  • 一种数据管理方法、装置、设备及存储介质-201910820812.3
  • 何少明;朱海军 - 腾讯科技(深圳)有限公司
  • 2019-08-29 - 2023-10-20 - G06F16/906
  • 本申请公开了一种数据管理方法、装置、设备及存储介质,通过对静态数据库中的数据进行分类,并根据数据之间的关联关系确定第一类数据和第二类数据,然后为所述第一类数据的多个路径要素生成第一存储路径,并根据所述第二类数据与所述第一类数据的对应关系对第一存储路径进行更新,以得到第二存储路径,继而对整体数据的数据读取路径进行更新;即通过梳理已有静态资源发布集成流程的关联关系,减少了各组开发人员之间依赖,提高开发效率;并自动化集成最新资源,防止资源遗漏;而且规范路径,资源使用更规范、清晰,提高了应用运行的稳定性。
  • 基于深度学习的数据安全分类方法及数据安全管理系统-202310875777.1
  • 吉欣晨;曹孙佳;程威威;谢俊杰;仇成群 - 盐城师范学院
  • 2023-07-17 - 2023-10-17 - G06F16/906
  • 本发明公开了基于深度学习的数据安全分类方法及数据安全管理系统,该方法包括以下步骤:S1、通过大数据配置中心获取业务信息系统中对应的业务数据;S2、对业务数据进行预处理,并对处理后的业务数据进行存储;S3、构建新型卷积神经网络HIDCNN组合模型;S4、对新型卷积神经网络HIDCNN组合模型进行训练,得到训练后的新型卷积神经网络HIDCNN组合模型;S5、根据训练后的新型卷积神经网络HIDCNN组合模型对数据进行分级分类。本发明将采集到的原始数据转换为所需的目标信息,在采集完成后,对数据进行清洗转换,提高了数据的安全性,避免发生数据丢失。
  • 一种数据自动分类分级方法-202310674624.0
  • 何磊;关中华;韩仁瑞 - 安徽辰图大数据科技有限公司
  • 2023-06-08 - 2023-10-13 - G06F16/906
  • 本发明公开了一种数据自动分类分级方法,本发明涉及数据分类分级技术领域,解决了根据过往记录进行数据分级,不能反映数据的真实性,因此在后续使用过程中会存在安全风险的技术问题,本发明通过对不同的数据根据类型进行初步分类,其次根据数据容量来进一步的进行二次分类,将数据进行同类型合理化整理,接着获取到二次分类数据的基础参数,并根据基础参数计算得到不同数据的分级值,同时将分级值进行排序,然后根据使用过程中的参数对分级值进行核验,进一步的确保数据分级的准确,从而提高数据的信息安全。
  • 一种基于深度学习的器件表面缺陷检测系统-202310728612.1
  • 宋永献;夏文豪;张磊;孔永;刘强;王博;李豪 - 南京晓庄学院
  • 2023-06-20 - 2023-10-13 - G06F16/906
  • 本发明涉及器件缺陷检测技术领域,用于解决现有的在对器件表面缺陷检测的方式,难以做到对检测环境及器件属性的准确分析,导致器件表面缺陷检测结果不准确,也难以对器件缺陷做出准确的预处理的问题,具体为一种基于深度学习的器件表面缺陷检测系统,包括数据采集单元、云数据库、待检器件预分析单元、检测环境分析单元、器件缺陷检测单元、器件缺陷预处理单元和显示终端。本发明,明确了器件的属性状态类型及所处检测环境状态,并以此为依据,又实现了对器件表面的缺陷程度状态的准确分析,并通过分析器件的性能状态以综合选择合适的预处理操作,保证器件表面缺陷检测结果的准确性,且有效降低生产成本和风险。
  • 类别检测方法、通关编码预测方法和装置-202210313388.5
  • 吴昊宇;戈伟 - 浙江菜鸟供应链管理有限公司
  • 2022-03-28 - 2023-10-13 - G06F16/906
  • 本申请实施例提供了类别检测方法、通关编码预测方法和装置。所述方法的实施例包括:获取目标对象的描述信息;获取目标对象的描述信息;基于描述信息,采用预先训练的多层级类别检测模型对目标对象进行多层级类别检测,得到目标对象的多层级类别信息,其中,训练多层级类别检测模型所使用的损失函数中包括全局损失项、局部损失项和惩罚项,惩罚项用于约束高层级类别检测结果的置信度高于低层级类别检测结果的置信度。该实施方式实现了提高了多层级类别检测结果的准确率。
  • 基于用户标签的数据处理方法、终端设备及存储介质-202110707306.0
  • 余辉;马万铮;王志国 - 深圳市酷开网络科技股份有限公司
  • 2021-06-23 - 2023-10-13 - G06F16/906
  • 本发明公开了一种基于用户标签的数据处理方法,所述基于用户标签的数据处理方法包括以下步骤:获取用户总标签的标签值类型,并基于所述标签值类型对应的预设算法计算出所述用户总标签的标签完备率;其中,所述用户总标签包括所有用户的用户标签;获取所述用户总标签的标签属性类型,并基于所述标签属性类型对应的预设计算规则,计算出所述用户总标签的标签准确率;基于所述标签完备率、所述标签准确率和预设的标签质量评估规则,确定出所述用户总标签的标签质量。本发明公开的基于用户标签的数据处理方法可解决现有用户标签的质量难以得到保证的技术问题。
  • 基于AI技术的外贸内容数据处理系统-202310942859.3
  • 蒋兰波;胡欣然;王复民;钟敏;杨超 - 长沙紫喇叭电子商务有限公司
  • 2023-07-31 - 2023-10-13 - G06F16/906
  • 本发明公开了一种基于AI技术的外贸内容数据处理系统,涉及数据处理领域,包含数据采集模块、数据预处理模块、标签化分类模块、数据分析模块、可视化监控中心和安全加固模块,所述数据采集模块的输出端与所述数据预处理模块的输入端连接,所述数据预处理模块的输出端与所述标签化分类模块的输入端连接,所述标签化分类模块的输出端与所述数据分析模块的输入端连接,所述数据分析模块与所述可视化监控中心双向连接,所述数据采集模块的输出端与所述可视化监控中心的输入端连接,所述安全加固模块全程工作;本发明能够实现对外贸内容进行自动化处理;自动化、智能化程度高。
  • 用户行为识别方法、装置、计算机设备和存储介质-202310828661.2
  • 周黄鹤;刘利军;张舟;秦辉辉 - 中国工商银行股份有限公司
  • 2023-07-07 - 2023-10-10 - G06F16/906
  • 本申请涉及一种用户行为识别方法、装置、计算机设备、存储介质和计算机程序产品,涉及计算机技术领域,可用于金融科技领域或其他相关领域。所述方法包括:基于从多渠道获取的多个用户行为,确定各个用户行为的至少一个行为特征;根据各个用户行为的至少一个行为特征,构建各个用户行为之间的关系拓扑图;关系拓扑图中的每个主节点对应一个用户行为,每个主节点下关联至少一个对应于用户行为的行为特征的子节点;遍历关系拓扑图中的各个子节点,基于各个子节点之间的连接关系,得到多个目标行为特征集;将每个目标行为特征集中的行为特征对应的用户行为,确认为同一个对公账户的用户行为。采用本方法,能够提升用户行为的识别准确率。
  • 数据汇聚方法、装置、设备及计算机可读存储介质-202310680187.3
  • 荀志 - 杭州数梦工场科技有限公司
  • 2023-06-08 - 2023-10-03 - G06F16/906
  • 一种数据汇聚方法、装置、设备及计算机可读存储介质。所述方法应用于需求方,需求方上部署有质量检测模块,需求方对应至少一个提供方,方法包括:接收至少一个提供方中的至少一个目标提供方响应于需求方发起的目标数据汇聚任务上传的待汇聚数据;目标提供方为目标数据汇聚任务中要求上传数据的提供方;将接收的待汇聚数据提供至质量检测模块,使质量检测模块按照目标数据汇聚任务的质量规则对待汇聚数据进行质量检测;将通过质量检测的待汇聚数据写入需求方的目的数据库中。本申请能够自动将接收的待汇聚数据按照质量规则进行质量检测,并将通过质量检测的待汇聚数据写入数据库中,不需要人工对汇聚的数据再进行检测和评估,节省成本,提高效率。
  • 一种基于全链路治理管控的数据治理系统-202311100015.0
  • 万力;韩东明;王庆焕;邢军鹏;李晓阳;刘其敏;邵龙;李冬冬 - 山东海博科技信息系统股份有限公司
  • 2023-08-30 - 2023-10-03 - G06F16/906
  • 本发明提供了一种基于全链路治理管控的数据治理系统。涉及数据治理领域,包括:数据分类模块:用于对目标数据进行规范化处理,并基于所属链路进行分类,得到第一数据集合;交互确定模块:用于获取第一数据集合中每一子集合之间的数据交互方式及交互程度,得到综合交互结果;管理分析模块:用于对每一子集合的第一数据进行数据分析检验,基于分析检验结果得到第一分析子集合;数据治理模块:用于基于方案数据库向第一分析子集合匹配数据治理方案,并基于综合交互结果对数据治理方案进行调整,得到综合治理方案进行数据治理。通过对不同链路的目标数据进行分类,并进行数据分析检验,匹配精准的数据治理方案,实现对全链路数据的精准治理管控。
  • 一种基于政务云数据自动分类分级的处理方法-202310366342.4
  • 翟建军;李周;胡赞;安亚鹏;张强;袁海;赵崇鹏 - 北京安信天行科技有限公司
  • 2023-04-07 - 2023-09-29 - G06F16/906
  • 本发明公开了一种基于政务云数据自动分类分级的处理系统,涉及分类分级技术领域,包括:采集管控模块、传输管控模块、处理管控模块、存储管控模块、使用管控模块。本发明借助政务云数据自动分类分级处理系统,依照运行数据分类分级规范,对运行维护、网络安全管理、数据管理等活动中产生的网络数据和非网络数据进行分类分级和权限控制。有利于对数据进行安全管控,同时可以保证数据分级使用和执行的可用性;采用流式处理方式,保证了数据分级的时效性和可复核性。
  • 一种基于全生命周期的用户管理系统和方法-202310741840.2
  • 王兢;朱明初;籍鹏飞;伍思婷;黄婷婷;康瑶瑶;王圆 - 云洞(上海)科技股份有限公司
  • 2023-06-21 - 2023-09-29 - G06F16/906
  • 本发明涉及一种基于全生命周期的用户管理系统和方法,属于用户管理技术领域。本发明包括信息采集模块、用户行为处理模块、用户信息处理模块、中央处理器、数据存储模块和信息输出模块,通过采集用户对于广告所产生的行为信息,锁定用户并采集该用户的用户信息,能够在繁琐的用户信息中快速有效地获取用户特征信息,并创建用户特征数据库以输出用户特征信息,基于用户特征信息计算得出具有此类特征信息的用户对不同类型广告的活跃值,实现针对处于不同生命周期的用户结合用户活跃值实现全生命周期的用户管理。
  • 一种交规速记、推送方法及系统-202310440407.5
  • 黎明 - 云南冲浪科技有限公司
  • 2023-04-23 - 2023-09-29 - G06F16/906
  • 本申请提出了一种交规速记、推送方法及系统,涉及人工智能领域。一种交规速记、推送方法包括:获取目标学员的基本信息、历史测试成绩及当前的驾驶知识点,结合历史驾考内容及当前的驾驶知识点进行知识点分类生成关键词;根据目标学员的知识点分类生成的关键词,将归属于关键词的道路安全法律知识点、安全文明知识点、待学习知识点确定当前知识点并存放至知识模型数据库中;根据目标学员的学习内容进行学习参考值的计算,将该目标学员的学习偏向值与学习参考值进行比对,为该目标学员推送最优的学习资源。能够提高相应科目的复习效率的技术效果,进而解决了出题方法效果不佳技术问题。
  • 一种图节点分类模型训练方法、图节点分类方法-202311086468.2
  • 李鑫;朱攀;陆伟;马召祎;赵晨廷;吕赛;李青松 - 南京邮电大学
  • 2023-08-28 - 2023-09-29 - G06F16/906
  • 本发明属于图机器学习、图表示学习技术领域,提供了一种图节点分类模型训练方法、图节点分类方法,具体涉及一种基于图注意力和改进Transformer图节点分类模型训练方法、图节点分类方法,具体将基于二级掩码的图注意力机制及结构强化学习、层间残差等优化策略融入Transformer框架,构建一种改进的Transformer模型以提高其对图数据的建模精度,同时兼顾小规模和中规模图数据集的节点分类任务,实现分类性能的全面提升。
  • 提升电路访问效率的方法及装置-202111198745.X
  • 张涌 - 厦门半导体工业技术研发有限公司
  • 2021-10-14 - 2023-09-26 - G06F16/906
  • 本发明公开了一种提升电路访问效率的方法及装置,其中,该方法包括:对输入数据进行分类分析,以获得第一类数据和第二类数据;采用通道预设编码的方式将所述第一类数据传输至目标位置,并对所述第二类数据进行冷热判断;获取所述第二类数据中的热数据,并根据所述热数据确定对应的预先生成数据,以及将所述对应的预先生成数据传输至所述目标位置;由此,通过对输入数据进行分类处理,使不需要通过移位寄存器进行传递的数据可以跳过该数据移位环节,节省了数据访问的时间开销,从而提高电路的整体访问效率。
专利分类
×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

400-8765-105周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top