[发明专利]基于变分自编码器的聚类方法和装置在审
申请号: | 202011206103.5 | 申请日: | 2020-11-02 |
公开(公告)号: | CN112488148A | 公开(公告)日: | 2021-03-12 |
发明(设计)人: | 裴丹;李之涵 | 申请(专利权)人: | 清华大学 |
主分类号: | G06K9/62 | 分类号: | G06K9/62;G06N3/04;G06N3/08 |
代理公司: | 北京清亦华知识产权代理事务所(普通合伙) 11201 | 代理人: | 张大威 |
地址: | 10008*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本申请公开了一种基于变分自编码器的聚类方法和装置,其中,方法包括:获取输入数据x;将输入数据x,结合变分自编码器,获取对应的离散类别隐变量y及连续高斯隐变量z;将输入数据x、离散类别隐变量y以及连续高斯隐变量z,结合变分自编码器,获取对应的联合概率分布q(z,y|x);利用变分自编码器对联合概率分布q(z,y|x)进行直接分解,根据离散类别隐变量y的概率分布,确定输入数据x的类别。该方法在变分自编码器的基础上进行改进,舍弃平均场近似,采用直接分解联合概率分布获取离散类别隐变量的概率分布,进而确定输入数据的类别,提高了聚类效果和准确度。 | ||
搜索关键词: | 基于 编码器 方法 装置 | ||
【主权项】:
暂无信息
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于清华大学,未经清华大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/202011206103.5/,转载请声明来源钻瓜专利网。
- 上一篇:蓄热装置、蓄热系统及蓄热系统的控制方法
- 下一篇:一种全密闭防尘防爆的工控机
- 同类专利
- 安全和隐私保护设备分类的系统和方法-202080004248.9
- 马赫什·凯雷莱普拉曼朱纳塔;基乌·华·徐 - 谷歌有限责任公司
- 2020-04-03 - 2022-11-25 - G06K9/62
- 本公开的至少一个方面针对安全和隐私保护设备分类的系统和方法。服务器可以维护多个数据记录,每个数据记录包括请求的指示和已知分类值。服务器可以使用多个请求和已知分类值中的每一个来训练场境模糊模型。服务器可以使用来自客户端设备的存储器中的数据结构的资源和类别信息来训练分类模型。服务器可以将场境模糊模型传送到不同的多个客户端设备。服务器可以接收包括分类矢量和请求元数据的分类的请求。服务器可以使用分类模型来确定对请求负责的设备的分类。服务器可以将设备分类传送到对请求负责的设备。
- 一种分布式大规模人脸聚类方法及装置-202010587955.7
- 李逸帆;丁保剑;秦伟;郑丁科;曾明;杨东泉 - 广州佳都科技软件开发有限公司;佳都科技集团股份有限公司
- 2020-06-24 - 2022-04-26 - G06K9/62
- 本申请实施例公开了一种分布式大规模人脸聚类方法及装置。本申请实施例提供的技术方案,通过将待聚类人脸图片进行分批聚类并汇总聚类结果,得到聚类集合和未聚类集合,从聚类集合的每个类中抽取设定数量的人脸图片构成代表类,并计算每一个未聚类人脸图片与每个代表类的相似度距离,得到相似度距离集合,基于相似度距离集合将未聚类人脸图片聚类到最相似的代表类中,并根据设定的链接阈值确定各个未聚类人脸图片与对应的代表类的链接关系,基于链接关系合并各个代表类,输出合并结果。采用上述技术手段,可以减少大规模人脸数据聚类的数据计算量,减少内存的消耗,在保障聚类结果稳定的前提下提升人脸聚类效率。
- 用于辅助标注模型训练数据的方法及系统-202110356694.2
- 谢铁 - 苏宁金融科技(南京)有限公司
- 2021-04-01 - 2022-04-12 - G06K9/62
- 本发明公开用于辅助标注模型训练数据的方法及系统,其中该方法包括:S1、构建两个训练集;S2、训练两个与所述训练集一一对应的分类器,通过两个分类器分别预测对方训练集中训练数据的类别,获取预测结果与作业人员标注的类别不一致的错误数据,并从所述错误数据中提取错误特征;S3、更新待标注数据池,并基于新的待标注数据池获取多个新的训练数据并分发到两个训练集中;S4、基于两个新的训练集重复上述步骤S2‑S3,直至两个训练集中的训练数据总数量达到预设值,将两个训练集中所有的训练数据导出。用于辅助标注模型训练数据的系统采用上述方法,筛选出一些有价值的模型训练数据,实现了在模型训练数据的标注过程中同时提高标注效率与标注质量。
- 基于改进BSMOTE-Sequence算法的风电设备故障检测方法-202110060075.9
- 强保华;杨鲜;陈锐东;谢元;李龙戈 - 桂林电子科技大学
- 2021-01-18 - 2022-04-12 - G06K9/62
- 本发明公开了一种风电设备故障检测方法,本发明基于改进的BSMOTE‑Sequence风机故障采样策略,通过对BorderlineSMOTE进行改进而设计的一种风机数据集采样策略模型。BorderlineSMOTE在选择对哪些样本点进行合成时,第一步通过KNN算法选出K′个少数类近邻样本,第二步从这K′个样本中随机选择K″个样本。本发明是将第二步随机选择样本改进为根据时序特征来选择样本,该方式生成新样本综合考虑了空间距离、时序规律,能有效减少噪声点的生成,不仅解决了风机数据集的不平衡问题,而且并未破坏数据集的时序规律。此外,本发明还结合Tomek Links技术,可以有效地过滤数据集中的噪声样本、类间重叠样本,从而提高后续分类器训练的效率及准确率,避免模型过拟合。
- 对目标对象分类的方法和装置-202110268662.7
- 罗嫚;刘健;郭明宇 - 支付宝(杭州)信息技术有限公司
- 2021-03-12 - 2022-04-12 - G06K9/62
- 本说明书实施例提供一种对目标对象分类的方法和装置。方法包括:客户端获取通过摄像头采集的目标对象的初始图像,所述初始图像具有第一分辨率;所述客户端通过频域变换,得到所述初始图像对应的频谱图;所述客户端将所述初始图像压缩后,得到具有第二分辨率的压缩图像;其中,所述第二分辨率小于所述第一分辨率;所述客户端向服务端发送所述频谱图和所述压缩图像,以使所述服务端根据所述频谱图和所述压缩图像对所述目标对象分类。能够提高对目标对象分类的准确率。
- 一种基于RFID卡的行为特征提取方法-201810533080.5
- 周庆;王卫芳;葛亮;张宇昂;邹东升;温亚梅;廖凤露 - 重庆大学
- 2018-05-29 - 2022-04-12 - G06K9/62
- 本发明公开了一种基于RFID卡的行为特征提取方法,属于信息技术领域,本发明将RFID卡中指定时间段内的刷卡记录进行分类处理,删除异常数据,并分别提取规律特征R、类别特征C和评分特征P,本发明可以处理数据记录量较大的数据,删掉异常值,将数据特征类型分类提取,从多角度针对每一个ID号提取对应的行为特征,分类详尽,数据提取精确;本发明可以可有效地关联匹配各类海量数据的,准确的提取行为特征。
- 目标检测模型的训练方法、目标检测方法及装置-201911093997.9
- 鲁方波;汪贤;樊鸿飞;蔡媛 - 北京金山云网络技术有限公司;北京金山云科技有限公司
- 2019-11-08 - 2022-04-12 - G06K9/62
- 本发明提供了一种目标检测模型的训练方法、目标检测方法及装置,涉及图像处理的技术领域,该方法包括:获取训练图像;训练图像携带有目标对象的标签信息;将训练图像输入至候选区域检测网络,得到目标对象的候选区域;将训练图像和候选区域输入至关键部位解析网络,得到关键部位解析网络输出的第一特征;通过训练图像、候选区域和关键部位解析网络输出的第一特征对待训练的目标检测模型进行训练,得到训练好的目标检测模型。本发明可以有效提高目标检测模型的准确率。
- 锂离子电池热失控分级预警方法及预警系统-202110435874.X
- 曹元成;曹志成;张炜鑫 - 华中科技大学
- 2021-04-22 - 2022-04-12 - G06K9/62
- 本发明提供了一种锂离子电池热失控分级预警方法及预警系统。该方法采用无故障的电池特征要素对长短期记忆网络、时间卷积网络和GRU神经网络构成的预测模型的热失控预测能力进行训练;接着将待监控电池在时间序列上的电池特征要素输入至预测模型,得到某一时刻的正常状态下的预测值,然后与采集到的该时刻对应的真实值比较,两者相差越大表明电池热失控风险越大。如此操作,既综合了各自的优势,又避免了各自模型训练出来的系数偏差过大问题,从而实现高精度的电池热失控分级检测,提高锂离子电池热失控预警的速度和精度。
- 针对目标图像的类别识别方法和装置-202110460794.X
- 暨凯祥;刘家佳;曾小英;胡圻圻;冯力国;王剑;陈景东 - 支付宝(杭州)信息技术有限公司
- 2021-04-27 - 2022-04-12 - G06K9/62
- 本说明书实施例提供一种针对目标图像的类别识别方法和装置,所述目标图像中包括文本,所述方法包括:识别所述目标图像中的文本内容,得到第一文本识别结果;将所述目标图像输入图像编码器,通过所述图像编码器输出所述目标图像对应的第一图像语义特征向量;将所述第一文本识别结果输入文本编码器,通过所述文本编码器输出所述第一文本识别结果对应的第一文本语义特征向量;将所述第一图像语义特征向量和所述第一文本语义特征向量输入多模融合编码器,通过所述多模融合编码器输出第一全局特征向量;根据所述第一全局特征向量,确定所述目标图像的目标类别。能够提高针对目标图像的类别识别的准确率。
- 一种跨模态融合目标跟踪方法-202110650615.9
- 左劼;杨勇;郭际香;魏骁勇 - 四川大学
- 2021-06-10 - 2022-04-12 - G06K9/62
- 本发明涉及计算机信息技术领域,提供了一种跨模态融合目标跟踪方法。目的在于解决跨模态目标之间的差异过于巨大,单纯使用基于特征的匹配难以获得较好的效果的问题。主要方案包括构建生成由像素对齐模块、特征对齐模块、联合判别模块组成的对抗神经网络,在数据集上训练生成对抗网络,从不同摄像头采集的视频中提取待识别目标,并输入训练好的联合判别模块,得到目标和所有待识别目标之间的特征相似度;使用标注的目标在摄像头之间的转移时间数据集,训练出一个根据转移时间预测目标之间的时间相似度的逻辑回归模型,利用该模型计算出两目标之间的时间相似度;特征相似度和时间相似度相加得到总相似度,总相似度最高的目标对即为同一目标。
- 晶圆处理方法及装置、存储介质和电子设备-201811149380.X
- 潘晓东 - 长鑫存储技术有限公司
- 2018-09-29 - 2022-04-12 - G06K9/62
- 本发明公开了一种晶圆处理方法及装置、存储介质和电子设备,涉及集成电路制造技术领域,可以应用于晶圆堆叠的场景中,该晶圆处理方法包括:根据目标晶圆上各芯片的测试数据确定目标晶圆上各预划分区域的等级标记;将所述目标晶圆上各预划分区域的等级标记输入一训练后的分类模型中,以确定所述目标晶圆的分类等级。本公开可以提高堆叠后集成电路的良率。
- 图像内容的分类方法、电子设备、路侧设备及云控平台-202110451854.1
- 夏春龙 - 阿波罗智联(北京)科技有限公司
- 2021-04-26 - 2022-04-05 - G06K9/62
- 本公开涉及图像内容的分类方法、装置、设备以及存储介质,计算机视觉、智能交通等领域。具体实现方案为:提取目标图像的特征,得到目标图像的特征图像;对特征图像进行优化处理,得到优化处理结果;利用优化处理结果,对目标图像中的内容进行分类。本公开无需事先对目标图像进行处理,可以实现对任意尺寸的目标图像进行分类。通过对目标图像的特征图像的优化,可以满足对目标图像内容分类的准确性。
- 图像分类模型训练分类方法、装置、路侧设备和云控平台-202110473572.1
- 夏春龙 - 阿波罗智联(北京)科技有限公司
- 2021-04-29 - 2022-04-05 - G06K9/62
- 本公开提供了一种图像分类模型的训练与图像分类的方法,涉及智能交通、计算机视觉和深度学习等人工智能技术领域。其中,图像分类模型的训练方法包括:获取训练数据;构建包含特征提取层、池化层、第一全连接层、第一分类层与第二分类层的神经网络模型,第一分类层用于根据所述第一全连接层的输出结果得到父类别,第二分类层用于根据所述第一全连接层的输出结果得到子类别;使用多张第一图像以及多张第一图像的第一标签与第二标签对所述神经网络模型进行训练,得到图像分类模型。图像分类的方法包括:获取待处理图像;将待处理图像作为图像分类模型的输入,将图像分类模型输出的父类别与子类别,作为待处理图像的分类结果。
- 一种实木定制柜门零件族划分的方法及系统-202111001660.8
- 熊先青;任杰;马清如;潘雨婷;周卓容;白洪涛 - 南京林业大学
- 2021-08-30 - 2022-04-05 - G06K9/62
- 本发明公开了一种实木定制柜门零件族划分方法及系统,属于家具生产技术领域。该方法包括获取实木定制柜门零件族属性指标;根据重要性程度对各属性指标进行排序;对各属性指标进行分类,其中,采用层次聚类法对尺寸进行分类,采用模糊聚类法对工艺进行分类,按照榫槽前期归类情况对榫槽进行分类,按照弯曲半径对弯曲程度进行分类;将各属性指标的聚类结果按照划分的类别字符串进行排序。系统包括属性指标获取单元、属性指标排序单元、属性指标分类单元和聚类结果排序单元,其中属性指标分类单元包括尺寸分类单元、工艺分类单元、榫槽结构分类单元和弯曲结构分类单元。本发明能够对实木定制柜门零件族进行划分,从而克服单指标分类的不足。
- 一种基于多尺度级联的糖尿病视网膜病变分级方法-202110845787.1
- 岳广辉;李苑;汪天富;林嘉琪;李洁玉;周天薇 - 深圳大学
- 2021-07-26 - 2022-04-05 - G06K9/62
- 本发明公开了一种基于多尺度级联的糖尿病视网膜病变分级方法,包括:提取输入图像多尺度信息的Res2Net基础网络、提取首层特征图的注意力模块、整合更具有鉴别性特征表示的感受野模块、多尺度级联网络;通过提取多尺度信息的方式减少浅层信息的丢失,并通过级联的方式对浅层信息和高层信息进行信息之间的融合,利用不同尺度信息之间的互补性来增强对信息的获取,结合多尺度和级联能有效提高DR的分级效果,具有一定的临床意义及算法意义。
- 基于LMDR算法的卷积神经网络入侵数据检测方法及系统-202010668918.9
- 龙春;李桥;魏金侠;赵静;杨帆 - 中国科学院计算机网络信息中心
- 2020-07-13 - 2022-03-25 - G06K9/62
- 本发明提供了基于LMDR算法的卷积神经网络入侵数据检测方法及系统,其通过数据预处理、LMDR特征增强、特征约减与数据图像化、卷积神经网络处理这四个方面进行入侵数据的处理,其主要利用LMDR算法对原始数据集合进行数据变换,以实现对原始数据的特征增强,相比于现有的采用机器学习算法和神经网络模型发的处理方式,其能够更加充分地挖掘不同数据特征之间的联系,从而有效地提高对入侵数据/非入侵数据的分类准确率以及降低数据分类的误报率。
- 基于比值的HRRP目标识别距离分类方法-201910864555.3
- 韩磊;姚璐;郭金东 - 北京理工大学
- 2019-09-12 - 2022-03-25 - G06K9/62
- 本发明公开的基于比值的HRRP目标识别距离分类方法,属于雷达目标识别领域。本发明是基于对传统的距离分类器进行优化实现的。在训练阶段:将用于训练的雷达回波信号进行预处理与特征提取处理,并利用处理后的雷达回波信号建立训练样本特征矩阵;从建立的训练样本特征矩阵中提取每类特征的最大值,构成一个特征归一化矩阵。在识别阶段:通过建立识别样本特征矩阵、合并特征矩阵、合并矩阵归一化、合并矩阵正值化、目标识别五个一级步骤,识别出待识别样本的目标类型,即实现基于HRRP的雷达目标识别。本发明能够应用于雷达目标识别领域,提高雷达目标识别的精度和稳定度,解决雷达目标识领域相关工程技术问题。
- 一种基于正交化局部敏感判别分析的铝板腐蚀检测方法-201811057750.7
- 钟永腾;张政浩;王淑慧;向家伟 - 温州大学苍南研究院
- 2018-09-11 - 2022-03-22 - G06K9/62
- 本发明公开了一种基于正交化局部敏感判别分析的铝板腐蚀检测方法,包括以下步骤:采集铝板的腐蚀散射信号;采用正交化局部敏感判别分析对信号进行处理,提取出具有高判别力的特征;建立训练样本和测试样本,采用循环神经网络对铝板的腐蚀程度进行检测。本发明具有以下优点和效果:本发明一方面采用正交化局部敏感判别分析对信号进行处理,可以提取出具有高判别力的局部特征,另一方面采用循环神经网络这一深度学习方法可有效检测铝板的腐蚀并且对腐蚀程度进行识别,运算周期短,准确率高。
- 一种信息匹配方法及相关装置-201610887444.0
- 张一昌;赵争超;张建伟;蔡仁贵;林君;肖谦;潘林林 - 阿里巴巴集团控股有限公司
- 2016-10-11 - 2022-03-15 - G06K9/62
- 本申请实施例提供了一种信息匹配方法及相关装置,所述方法包括:获取待匹配的第一信息和第二信息;获取标签类目树,所述标签类目树包括至少两层,每层包括至少一个标签节点,每个标签节点的父标签节点为该标签节点的父类目;从所述标签类目树中获取第一树枝和第二树枝,所述第一树枝的最低层的标签节点与所述第一信息的内容相匹配,所述第二树枝的最低层的标签节点与所述第二信息的内容相匹配;至少根据所述第一树枝与所述第二树枝在每层分别对应的匹配度,计算所述第一信息和所述第二信息的匹配度。可见,本申请实施例计算出的匹配度能够反映信息之间的关联性,从而提高匹配准确率。
- 一种基于物联网云平台大数据的采集装置-202122088932.4
- 黄锋;王振炯;宣锋锋 - 绍兴锋锐电子科技有限公司
- 2021-08-31 - 2022-03-15 - G06K9/62
- 本实用新型公开了一种基于物联网云平台大数据的采集装置,包括数据平台,数据平台包括数据采集单元和安全检测单元,数据平台还包括客户终端、平台服务器和数据库,数据采集单元包括数据输入、数据处理和数据输出,安全检测单元包括数据安全性分析和数据安全处理,本实用新型结构合理,通过数据采集单元将用户数据进行采集,随后经过安全检测单元对用户数据安全性进行分析和检测,数据传递至安全监测单元上进行数据安全性的分析,之后将用户数据分定为有用数据和无用数据,有用数据传输至数据平台上,数据安全处理可对无用数据中的具有威胁性的数据进行处理,防止危险数据侵入整个数据平台而影响数据平台的正常工作。
- 基于大数据挖掘技术的风电场群发电能力评估方法-201810142929.6
- 马明;沈润杰;何斌;汪宁渤;曹银利;吕清泉;韩旭杉;马彦宏;李晓虎;张鹏;韩自奋;张健美;周强;赵龙;王明松;王定美;陈钊;张艳丽;王琼;张睿骁 - 同济大学;甘肃省电力公司风电技术中心;国网甘肃省电力公司;国家电网公司
- 2018-02-11 - 2022-03-11 - G06K9/62
- 本发明公开了一种基于大数据挖掘技术的风电场群发电能力评估方法,具体步骤为:多种传感器的风电场风速获取;风电场内立体式风速分布关联图建立;多种方法数据融合的风电场发电能力评估;进行风电场群风速立体网络建立;实现基于大数据挖掘技术的风电场群发电能力评估。本发明公开的方法创新性的引用基于空间降尺度的风电场群相关性区域划分方法,使风速计算和获取更为精确;使用标杆风机法、修正风速网络方法、理论出力还原表法计算总理论出力,同时将卡尔曼数据融合应用在理论出力方面,使得总理伦出力计算更为准确。
- 视觉词典生成方法及装置、存储介质-201910595710.6
- 方攀;陈岩;李姬俊男 - OPPO广东移动通信有限公司
- 2019-07-03 - 2022-03-08 - G06K9/62
- 本发明公开了一种视觉词典生成方法,包括:获取目标定位区域内环境图像所对应的至少一个特征信息;其中,所述特征信息包括所述环境图像中局部元素的相关信息;基于所述环境图像所对应的至少一个特征信息,构建与所述目标定位区域对应的目标视觉词典;所述目标视觉词典中至少包括所述目标定位区域内多个物体图像的局部元素的相关信息;所述目标视觉词典用于对目标定位区域中待定位图像进行语义表示。本发明的实施例同时公开了一种视觉词典生成装置以及计算机可读存储介质。
- 样本图像生成方法、装置及其相关设备和存储介质-202111154752.X
- 鲁盈悦;金博伟;支洪平;许琢;孙萍;金玥;苏晓芸;王旭;高逸晨 - 科大讯飞(苏州)科技有限公司
- 2021-09-29 - 2022-03-08 - G06K9/62
- 本申请公开了一种样本图像生成方法、生成装置、生成设备和计算机可读存储介质,该方法包括:由待识别物图像获取待识别物掩膜,由待填充物图像获取待填充物掩膜;根据待识别物掩膜和待填充物掩膜的关系,将待识别物图像和待填充物图像进行融合,得到融合图像;利用待识别物掩膜对待识别物图像进行与操作,确定待识别物图像中的第一融合区域;利用待识别物掩膜对待填充物图像进行与操作,确定待填充物图像中的第二融合区域;响应于融合图像中对应第一融合区域的可见程度和对应第二融合区域的可见程度满足预设要求,确定融合图像为样本图像。通过上述方式,本申请能够保证样本图像真实有效。
- 基于特征分化的交易欺诈行为深度检测方法-201810641664.4
- 蒋昌俊;章昭辉;王鹏伟;汪立智;张晓波;周欣欣 - 东华大学
- 2018-06-20 - 2022-03-04 - G06K9/62
- 本发明涉及一种基于特征分化的交易欺诈行为深度检测方法,其特征在于,提出了基于交易时间的分化特征生成方法和带有离群样本检测的欺诈交易检测方法。本发明提出的网络交易欺诈检测方法,可以有效检测网络交易中的欺诈行为,本发明提供的方法从实用性角度出发,通过分化特征生成方法和带有离群样本检测的欺诈交易检测方法,建立了网络交易欺诈检测系统,为解决欺诈交易检测提供了技术支持。
- 基于素描及结构生成对抗网络的SAR图像样本生成方法-201810928531.5
- 刘芳;李玲玲;王哲;焦李成;陈璞花;郭雨薇;马文萍;杨淑媛;侯彪 - 西安电子科技大学
- 2018-08-15 - 2022-03-04 - G06K9/62
- 本发明提供的一种基于素描及结构生成对抗网络的SAR图像样本生成方法,主要解决SAR图像语义分割中存在的样本不平衡问题,其实现步骤是:(1)SAR图像素描化,得到素描图;(2)根据SAR图像的区域图,提取较小的极不匀质区域;(3)构造形为素描块‑SAR图像块的成对数据集;(4)选取数据集里的样本组成训练集和测试集;(5)构造基于素描信息及结构约束的生成对抗网络;(6)通过素描线损失、对抗损失和生成器损失对素描拟合网络、判别网络和生成网络依次进行交替训练;(7)输入测试素描块到训练好的生成网络,得到生成SAR图像块;本发明能够根据素描图生成与原SAR图像地物结构吻合的SAR图像样本,可解决SAR图像极不匀质区域分类的样本不平衡问题。
- 一种优化训练样本的方法和装置-201711261004.5
- 郭玉锐;周雪梅;朱月飞;张达 - 北京京东尚科信息技术有限公司;北京京东世纪贸易有限公司
- 2017-12-04 - 2022-03-04 - G06K9/62
- 本发明公开了一种优化训练样本的方法和装置,涉及计算机技术领域。该方法的一个具体实施方式包括:获取同一标注对象的两个以上的标注集;根据预设规则对所述两个以上标注集进行合并和/或相交,得到优选标注集;将所述优选标注集填充至所述标注对象,得到训练样本。该实施方式降低了人工标注易造成经验性错误的概率,能够获得更准确的训练样本,进而达到提高模型验证准确性的技术效果。
- 图像合成方法、装置、电子设备和计算机可读存储介质-201910292543.8
- 王诗吟 - 北京字节跳动网络技术有限公司
- 2019-04-12 - 2022-03-04 - G06K9/62
- 本公开公开了一种图像合成方法,其特征在于,包括:获取第一图像和第二图像,其中所述第一图像的图像特征对应第一属性值,所述第二图像的所述图像特征对应第二属性值;根据所述第一图像和所述第二图像合成第三图像,其中所述第三图像的所述图像特征对应第三属性值,所述第三属性值大于所述第一属性值,并且所述第三属性值小于所述第二属性值。本公开实施例提供的图像合成方法、装置、电子设备和计算机可读存储介质,基于分类器的训练集合中对应不同属性值或类别的图像数据,合成的图像数据可以用于丰富分类器的训练数据,提高分类器的分类效果。
- 数据分类方法、装置、设备及存储介质-202110336040.3
- 祖辰;杨立军 - 北京沃东天骏信息技术有限公司;北京京东世纪贸易有限公司
- 2021-03-29 - 2022-03-01 - G06K9/62
- 本公开提供一种数据分类方法、装置、设备及存储介质,涉及机器学习技术领域。该方法包括:获取相同类别的样本对和不同类别的样本对;分别获得所述相同类别的样本对的协方差矩阵和所述不同类别的样本对的协方差矩阵;根据所述相同类别的样本对的协方差矩阵和所述不同类别的样本对的协方差矩阵获得优化函数,所述优化函数的变量包括维度相关性矩阵和不同类别样本对与相同类别样本对的维度相关性距离平方和比值;通过所述优化函数对所述初始维度相关性矩阵向着所述维度相关性距离平方和比值更大的方向进行迭代更新,获得优化后的维度相关性矩阵,以基于所述优化后的维度相关性矩阵对待分类数据进行分类。该方法提高了数据分类的准确性。
- 聚类方法、装置、电子设备及存储介质-202110360295.3
- 韩雨锦;李怡欣;陈晓霖;王虎;黄志翔;彭南博 - 京东科技控股股份有限公司
- 2021-04-02 - 2022-03-01 - G06K9/62
- 本申请提出了一种聚类方法及装置,其中,适用于业务节点的方法包括针对每个类簇,基于属于所述类簇的目标第一样本的编号,生成所述类簇的簇向量,并对所述簇向量加密后发给参与节点,其中,所述簇向量用于表征所述类簇的簇心;获取每个类簇对应的所述业务节点的第一样本到簇心的第一差矩阵,以及对应的所述参与节点的第二样本到所述簇心的第二差矩阵;根据每个类簇的所述第一差矩阵和所述第二差矩阵更新簇心,以所述更新的簇心对所述第一样本进行重分簇,并以重分簇后得到的每个类簇作为下一次迭代对应的类簇,返回执行上述步骤直至迭代结束,生成最终的目标类簇。本申请中,通过对交互的数据的加密,有效保证了数据安全及保密性。
- 一种共享单车位置预测方法、设备及存储介质-202111120247.3
- 赵生捷;贾文祯;邓浩 - 同济大学
- 2021-09-24 - 2022-03-01 - G06K9/62
- 本发明涉及一种共享单车位置预测方法、设备及存储介质,该方法基于迁移趋势,将站点与该相关簇间的迁移趋势矩阵作为特征值融入到站点位置信息中,采用模糊C均值聚类FCM算法对共享单车数据集进行迭代聚类,从而输出共享单车移动预测结果。与现有技术相比,本发明准确度高的、紧贴实际等具有优点。
- 专利分类