[发明专利]聚类模型的训练方法、聚类方法、装置、设备及存储介质在审

专利信息
申请号: 202210126447.8 申请日: 2022-02-10
公开(公告)号: CN114462540A 公开(公告)日: 2022-05-10
发明(设计)人: 王亮;姚建华 申请(专利权)人: 腾讯科技(深圳)有限公司
主分类号: G06K9/62 分类号: G06K9/62;G06N3/04;G06N3/08
代理公司: 北京三高永信知识产权代理有限责任公司 11138 代理人: 李文静
地址: 518057 广东省深圳*** 国省代码: 广东;44
权利要求书: 查看更多 说明书: 查看更多
摘要: 本申请公开了一种聚类模型的训练方法、聚类方法、装置、设备及存储介质,属于人工智能技术领域。方法包括:获取多个第一对象数据、多个第二对象数据以及各个第一对象数据的标注聚类结果;根据第一网络模型获取各个第一对象数据的第一预测聚类结果和各个第二对象数据的第一预测聚类结果;基于各个第一对象数据的标注聚类结果、第一预测聚类结果以及各个第二对象数据的第一预测聚类结果对第一网络模型进行调整,得到聚类模型。通过少量数据的标注聚类结果引导模型进行准确聚类,提升聚类模型的准确性,从而提升聚类结果的准确性。
搜索关键词: 模型 训练 方法 装置 设备 存储 介质
【主权项】:
暂无信息
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于腾讯科技(深圳)有限公司,未经腾讯科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/patent/202210126447.8/,转载请声明来源钻瓜专利网。

同类专利
  • 车载网络故障诊断方法和诊断装置、存储介质、终端设备-202211479039.7
  • 何传亮;夏信;张博;梁艳新;武志新;王进;马威振;张立勇 - 北京电科智芯科技有限公司
  • 2022-11-24 - 2022-12-30 - G06K9/62
  • 本发明公开了一种车载网络故障诊断方法和诊断装置、存储介质、终端设备,所述方法包括:获取车载网络故障的原始数据,并对原始数据进行处理以获得车载网络故障诊断的数据集;建立优化车载网络故障诊断模型的目标函数;根据目标函数计算适应度值,记录第t次迭代的最优海鸥位置;获取更新后的海鸥位置;获取变异后的最优海鸥位置;在迭代次数达到预设迭代阈值时,将最后一次迭代获得的最优海鸥位置作为车载网络故障诊断模型的模型参数,并将测试数据集输入车载网络故障诊断模型,得到故障诊断结果。本发明的故障诊断方法,能够克服现有海鸥算法的缺陷,显著提升车载网络故障诊断的效果。
  • 一种模型训练方法及装置-202211487214.7
  • 陈杰 - 北京红棉小冰科技有限公司
  • 2022-11-25 - 2022-12-30 - G06K9/62
  • 本发明提供一种模型训练方法及装置,可以从数据记录日志中,提取出第一数量的匹配行为记录数据;其中,各匹配行为记录数据均包括相对应的待匹配数据和标注有样本类别标识的至少一条反馈数据,样本类别标识包括正样本标识和负样本标识;按照同一匹配行为记录数据中正样本匹配度高于负样本匹配度的训练目标,利用各匹配行为记录数据对数据匹配模型进行训练;其中,正样本匹配度为标注有正样本标识的反馈数据与待匹配数据的匹配度,负样本匹配度为标注有负样本标识的反馈数据与待匹配数据的匹配度。本发明可以优化对数据匹配模型的训练效果,使得数据匹配模型可以匹配到以及向用户展示更能满足用户实际需求或更感兴趣的数据。
  • 一种基于CARLA神经网络的故障诊断方法、装置和计算机可读存储介质-202211332843.2
  • 吴玉虎;郝崟霖;孙希明;吕宗阳 - 大连理工大学
  • 2022-10-28 - 2022-12-30 - G06K9/62
  • 本发明属于机械装备故障诊断领域,提出一种基于CARLA神经网络的故障诊断方法、装置和计算机可读存储介质。根据CARLA对神经网络的参数进行设定;每一个CARLA负责一个神经网络参数,维持一个神经网络参数的概率密度函数。不同连续动作强化学习机之间并行运行;通过对概率密度函数积分计算等于某个随机数值,得到本次训练的神经网络参数,使用训练集进行训练神经网络;通过结果计算评估函数得到每次训练的迭代函数;每一次训练所产生的函数迭代至对应神经网络参数的概率密度函数中,最后根据概率密度的分布选取最重要神经网络参数值。通过本发明的方法可以有效的避免采用梯度进行参数更新时可能出现的梯度消失等问题。
  • 点云数据处理方法、模型训练方法、设备、介质及产品-202210334625.6
  • 王喆;单成亮;向哲;张乐翔;杨洋;万斌 - 高德软件有限公司
  • 2022-03-30 - 2022-12-30 - G06K9/62
  • 本公开实施例公开了一种点云数据处理方法、模型训练方法、设备、介质及产品,所述方法包括:获取待处理点云数据以及预先训练得到的目标点云分割模型,并将待处理点云数据输入目标点云分割模型,以获取目标点云分割模型输出的点云分割信息;根据物体标识信息在待处理点云数据中确定与同一个物体的空间点对应的目标待处理点云数据,并根据同一个物体的空间点的物体类别信息对目标待处理点云数据进行补全,以获取目标补全点云数据。该方案可实现单独对被准确区分的属于物体类别下的单个物体所对应的空间点的点云数据进行补全的目的,从而确保基于补全后的点云数据可以准确区分物体的类别以及不同的独立物体,提高了补全处理后的点云数据的可靠性。
  • 一种面向选冶渣场在线监测系统的时间序列异常检测方法-202211322936.7
  • 华绍广;季云云;李书钦;李香梅;姚俊;裴德健 - 中钢集团马鞍山矿山研究总院股份有限公司
  • 2022-10-27 - 2022-12-30 - G06K9/62
  • 本发明公开了一种面向选冶渣场在线监测系统的时间序列异常检测方法,属于选冶渣场在线监测技术领域。本发明的步骤为:从数据库中提取数据,填补缺失值,删除部分相关系数较高的原始指标,对保留下来的指标通过特征工程构建统计特征、时间特征与时序特征;所有特征进行归一化处理,通过无监督算法进行多数投票确定异常标签;对经处理后的标签数据进行特征选择,通过这些重要性指标来提升无监督算法的检测性能;再结合行业标准修正伪标签;最后对无监督算法的检测结果进行加权融合,实现了基于少量监测项目构建统计特征、时间特征和时序特征,以有监督算法辅助无监督算法进行重要特征选取,提高无监督异常检测算法的性能。
  • 基于集成学习器的恶意程序API调用序列检测方法-202211015410.4
  • 杨强;汪金明;杨涛;阮伟;王文海 - 浙江大学
  • 2022-08-24 - 2022-12-30 - G06K9/62
  • 本发明提出了一种基于集成学习器的恶意程序API调用序列检测方法。本发明使用多个基分类器作为集成学习器第一层内容,对训练集样本打标签进行有监督学习;模型训练完成后得到基分类器组,基分类器组中每个基分类器对验证集样本进行打标签,从而最终得到一个由N个基标签组成的基标签向量集;将基标签向量集作为训练集输入到元分类模型进行训练,得到元分类器;实践应用中,在基分类器组和元分类器都完成训练后,经过数据处理的API调用序列被输出到基分类器组得到基标签向量,再将基标签向量输入到元分类器,由元分类器给出此API序列的最终标签。
  • 一种基于深度孪生自注意力网络的航空发动机小样本故障诊断方法-202211057935.4
  • 钟诗胜;赵明航;刘丹;林琳;付旭云;刘雪云 - 哈尔滨工业大学(威海)
  • 2022-08-31 - 2022-12-30 - G06K9/62
  • 本申请提供了一种基于深度孪生自注意力网络的航空发动机小样本故障诊断方法,采用时间序列聚类和孪生神经网络相结合,实现航空发动机小样本故障的诊断。本申请通过学习一种相似性度量来解决小样本条件下多标签分类问题,有效地提高小样本条件下多故障分类的准确率,有效地缓解深度神经网络的过拟合问题;使用SANet作为孪生神经网络的特征提取模块,以期学到更丰富的时序特征,进而提高不同类型样本在映射空间中的可分性;SANet可以同时提取时间序列的短期依赖和长期依赖,并在提取长期依赖方面优于RNN模型;有效地缓解样本不均衡所带来的训练问题,对故障样本的诊断效果更佳。
  • 生成对比学习模型的负样本对的方法、装置、设备和介质-202211396002.8
  • 吴昊;杨成 - 北京有竹居网络技术有限公司
  • 2022-11-08 - 2022-12-30 - G06K9/62
  • 提供了生成对比学习模型的负样本对的方法、装置、设备和介质。在一种方法中,从用于训练对比学习模型的多个数据序列中的第一数据序列中获取第一数据段,并且从多个数据序列中的第二数据序列中获取第二数据段。从多个数据序列中的第二数据序列以外的其他数据序列中选择数据帧。基于第二数据段和数据帧,生成第三数据段。基于第一数据段和第三数据段,确定用于训练对比学习模型的负样本对。利用本公开的示例性实现方式,可以在外观方面向负样本对中引入更为丰富语义信息,进而提高对比学习模型的准确性。
  • 一种识别加密应用的方法、装置及电子设备-202110729535.2
  • 梁兴强;苏香艳 - 北京观成科技有限公司
  • 2021-06-29 - 2022-12-30 - G06K9/62
  • 本发明提供了一种识别加密应用的方法、装置及电子设备,其中,该方法包括:获取多种加密应用的多个样本加密流量;根据样本加密流量训练得到每种加密应用所对应的二分类模型,二分类模型能够识别加密流量是否属于相应的加密应用;将待识别的目标加密流量输入至多个二分类模型,确定目标加密流量所属的目标加密应用。通过本发明实施例提供的识别加密应用的方法、装置及电子设备,对每种加密应用分别构建二分类模型,基于多个二分类模型共同识别加密流量,可以在加密应用种类繁多且数据量庞大时,准确识别加密流量所属的加密应用,该方法通过提高每一个二分类模型的精确度,能够避免出现误报。
  • 异常数据识别、标签识别方法和异常数据识别装置-202211207011.8
  • 周帆;徐开明;王栋慧 - 上海浦东发展银行股份有限公司
  • 2022-09-30 - 2022-12-30 - G06K9/62
  • 本申请涉及一种异常数据识别方法、标签识别方法、异常数据识别装置、计算机设备、存储介质和计算机程序产品,通过获取待识别的样本数据,并根据样本数据构建回归决策树模型,进而根据预设识别规则以及回归决策树模型获取异常数据的识别条件,根据识别条件识别样本数据中的异常数据,能够准确识别样本数据中的异常数据,从而根据将异常数据剔除后的目标训练数据构建对应的标签识别模型,能够提升模型识别的准确率,实现标签的准确识别。
  • 结合不确定度与密度聚类算法的多波束异常值自动滤波方法-202211217462.X
  • 金绍华;王俊森;崔杨;边刚;胡泽群 - 中国人民解放军海军大连舰艇学院
  • 2022-10-04 - 2022-12-30 - G06K9/62
  • 本发明公开了一种结合不确定度与密度聚类算法的多波束异常值自动滤波方法,属于多波束测深数据处理技术领域。本发明根据CUBE滤波算法构建网格节点可吸收水深点选取模型,对测深数据网格化;利用DBSCAN聚类算法对节点可吸收的水深值进行一维聚类,根据水深值之间的差值构建多个水深假设,然后使用卡尔曼滤波更新节点的水深假设和不确定度;最后从多个水深假设中选取可信度较高的水深假设作为节点的真实水深值。本发明可以为国产多波束测深数据处理软件提供一种多波束测深数据自动清理算法的选择。
  • 一种多无人机中的AoI敏感的数据收集方法及系统-202211222924.7
  • 翟临博;高星霞;邓晓珂;贾钰鹃;杨峰;赵景梅 - 山东师范大学
  • 2022-10-08 - 2022-12-30 - G06K9/62
  • 本发明提供了一种多无人机中的AoI敏感的数据收集方法及系统,涉及移动通信技术领域,包括采集地面传感器的数量和位置信息,并初始化地面传感器的数量和位置;确定数据采集点的数量以及各个数据采集点的位置坐标,建立SN‑CP关联;根据数据采集点的位置坐标和SN‑CP关联,对数据采集点进行聚类,再建立CP‑UAV关联;根据数据采集点的坐标和CP‑UAV关联,以最小化每个传感器数据的平均AoI和最大AoI对每个数据采集点下的无人机轨迹进行优化,完成数据收集;在保证传感器信息新鲜度的同时完成了数据收集任务。
  • 时序数据趋势告警方法、系统及趋势告警模型训练方法-202211237929.7
  • 邓刚;张玉斌 - 苏州德姆斯信息技术有限公司
  • 2022-10-10 - 2022-12-30 - G06K9/62
  • 本发明公开了一种时序数据趋势告警方法、系统及趋势告警模型训练方法,其中,训练方法包括:准备样本源数据,包括监测值及对应的时间戳;以第一时间间隔为窗口宽度切割样本源数据,得到多个原始样本;对每一个原始样本进行以第二时间间隔为组距的分组处理,得到中间样本;为每个中间样本标注多个标签,得到训练样本;利用完成标签标注的训练样本对基于卷积神经网络的基础模型进行训练,直至模型收敛,得到趋势告警模型。本发明采用多标签学习的方式训练得到的工业时序数据趋势告警方法及系统能更多地提取由趋势产生的特征,进而提高模型的泛化性和告警准确率。
  • 一种多模态数据的融合方法、系统及存储介质-202211107885.6
  • 鲍尚策;刘立峰;刁海峰;于晓涛;母健康;王文重;张建军 - 珠海高凌信息科技股份有限公司
  • 2022-09-13 - 2022-12-30 - G06K9/62
  • 本发明公开了一种多模态数据的融合方法、系统及存储介质,方法包括:获取多模态原始数据;对文本数据进行分词编码操作,结合卷积神经网络提取得到预设维度的文本特征;对语音数据进行端点检测,结合语音特征提取工具包提取得到预设维度的语音特征;对视频数据进行序列化处理,结合循环神经网络提取得到预设维度的视频特征;对文本特征、语音特征和视频特征进行对齐拼接处理,得到预设通道的特征向量;根据特征向量,通过多核分类模型进行线性连接,得到多模态特征分类结果。本发明能够实现对文本、语音和视觉的多模态数据的统一特征提取和融合,从而促进从单模态数据到多模态数据的分析和应用,可广泛应用于数据处理技术领域。
  • 基于区域生长的火电机组稳定工况识别方法、终端及介质-202211118872.9
  • 孙娜;刘曙元;叶君健;谷薇;张勤;吴娜 - 国能信控互联技术有限公司
  • 2022-09-13 - 2022-12-30 - G06K9/62
  • 本发明涉及一种基于区域生长的火电机组稳定工况识别方法、终端及介质,其特征在于,所述方法包括以下步骤:步骤1,采集火电机组测点的历史数据,以构建不同时间点下所述火电机组的工况识别向量;步骤2,基于预设的时间间隔,从所述工况识别向量中选取种子点从而实现区域生长;步骤3,当某个种子点在实现区域生长的过程中达到了预设区域边界,则对区域边界的扩展方向进行判定,并继续实现对当前种子点的区域生长,以获得所述火电机组的工况稳定时段;步骤4,将所述工况稳定时段进行筛选,并根据符合条件的所有的所述工况稳定时段判定所述火电机组的当前工况。本发明改进了区域生长逻辑,确保了工况识别的准确性。
  • 客户类型确定方法及装置-202211121949.8
  • 任凌然 - 中国银行股份有限公司
  • 2022-09-15 - 2022-12-30 - G06K9/62
  • 本发明公开了一种客户类型确定方法及装置,涉及人工智能及大数据技术领域,其中该方法包括:获取目标客户的收支信息;通过预设的文本特征提取模型从所述收支信息中提取出所述目标客户的收入信息以及金融产品历史购买信息,其中,所述文本特征提取模型为根据HAAR算法模型训练得出的;将所述收入信息以及所述金融产品历史购买信息输入到预设的客户分类模型中,得到所述目标客户的客户类型,其中,所述客户分类模型为根据支持向量机算法模型训练得出的。本发明实现了准确高效的确定出目标客户的客户类型的有益效果,有助于提高对客户进行产品营销的效果和效率。
  • 多任务模型的训练方法、内容推荐方法及装置-202211293317.X
  • 林中平 - 微梦创科网络科技(中国)有限公司
  • 2022-10-21 - 2022-12-30 - G06K9/62
  • 本申请实施例提供了一种多任务模型的训练方法、内容推荐方法及装置,该多任务模型的训练方法包括:获取训练样本,训练样本至少包括用户行为数据、用户特征和与用户行为数据对应的历史浏览数据;根据用户行为数据、历史浏览数据和用户特征确定目标用户的兴趣向量表征;将兴趣向量表征输入到待训练的多任务模型中进行训练,直至待训练的多任务模型的目标损失函数收敛,得到训练好的多任务模型。
  • 基于对抗样本检测和矩阵分解的集成防御方法-202211180101.2
  • 周维;何伟;王汝欣;宋冰冰 - 云南大学
  • 2022-09-27 - 2022-12-30 - G06K9/62
  • 本发明公开了一种基于对抗样本检测和矩阵分解的集成防御方法,对于目标模型的输入样本,首先采用基于阈值的对抗样本检测方法进行对抗样本检测,如果检测到输入样本为对抗样本,则对于对抗样本基于矩阵分解进行数据重构,得到重构样本,当输入样本为正常样本时,直接将输入样本输入目标模型进行预测,得到输入样本的预测结果;当输入样本为对抗样本时,将重构样本输入目标模型进行预测,作为输入样本的预测结果。本发明通过基于阈值的对抗样本检测方法和基于矩阵分解的输入样本重构方法两种技术的结合,从而有效防御对抗样本,提高目标模型的鲁棒性。
  • 基于LSTM的GB-InSAR大气相位补偿方法-202211182965.8
  • 刘毓;吴昊;陈娇;杨志航;王浩琦;程洁 - 重庆三峡学院
  • 2022-09-27 - 2022-12-30 - G06K9/62
  • 本发明涉及大气相位补偿技术领域,公开了基于LSTM的GB‑InSAR大气相位补偿方法,由于电磁波传播在每个方位向大气延迟系数可能存在的差异,从而导致大气在雷达数据监测上具有空变性影响,因此,常规大气相位补偿方法不再适用。本文提出了基于LSTM的大气相位补偿方法,首先计算PS点的相关系数与相位平均值,构建评价因子,选取评价因子输入LSTM获取PS点时序相位变化特征,构建分类模型,利用K‑means方法对所有PS点分类,选择标准差最小的类别作为稳定点验证模型得可靠性,获取合适的分类模型。然后利用分类模型对所有PS点分类,选出稳定PS点。最后根据稳定PS点进行Lowess插值拟合,补偿PS点的大气相位。此方法能适用于天气环境较为复杂的场景。
  • 一种基于残差神经网络的高速列车转向架故障诊断方法-202211197869.0
  • 董宏辉;满洁;贾利民;秦勇 - 北京交通大学
  • 2022-09-29 - 2022-12-30 - G06K9/62
  • 本发明公开了属于高速列车故障诊断技术领域的一种基于残差神经网络的高速列车转向架故障诊断方法。高速列车转向架系统分为动力转向架和非动力转向架,复杂转向架系统可能诱发的故障种类多样,首先在列车转向架状态监测系统中安装多个不同种类的传感器,对重要部件进行状态监测和故障识别,建立RS‑GAT故障诊断模型,对转向架各部位进行故障诊断,并通过通信网络将列车转向架的状态信息实时传输到地面数据中心,由数据中心进行离线的模型训练,对高速列车转向架故障诊断;确保高速铁路列车在途运行的安全。
  • 一种基于随机森林的车辆能耗监测方法-202211205788.0
  • 韩大鹏 - 华人运通(山东)科技有限公司
  • 2022-09-30 - 2022-12-30 - G06K9/62
  • 本发明提供了一种基于随机森林的车辆能耗监测方法,该方法包括:根据待监测车辆的车辆历史数据,得到能耗影响特征;利用随机森林算法对所述能耗影响特征进行排名,得到所述能耗影响特征的重要性排名;根据所述能耗影响特征的重要性排名,对所述能耗影响特征进行分类;根据各个分类中的能耗影响特征,对待监测车辆能耗进行分析,得到能耗分析结果;本发明基于大数据和机器学习随机森林,可以准确分析出电动汽车的在行驶过程中的实际能耗情况,实现能耗的动态标定。
  • 基于KNN算法的用户分类方法及装置-202211271947.7
  • 刘京;李亚雄;马小菲;刘航 - 中国银行股份有限公司
  • 2022-10-18 - 2022-12-30 - G06K9/62
  • 本发明提供了一种基于KNN算法的用户分类方法及装置,对应的方法包括:接收用户的个人信息;根据所述个人信息以及预先建立的KNN用户分类模型对多个用户进行分类,所述KNN用户分类模型是基于KNN算法所生成的。本发明采用的KNN分类算法简单易用,模型训练时间快,其建立的模型结构完全是根据数据来决定的,符合现实情况,比较适用于样本容量较大的分类情况,对异常值不敏感,因此对于银行贷款数据分类的适用性很高,并且KNN分类算法具有很好的预测效果,对于贷款违约风险的预测把控可以提供较为可信的参考。
  • 一种双编码半监督非靶向食品污染物检测方法-202211152644.3
  • 关佶红;李辉;李文根;张毅超 - 同济大学
  • 2022-09-21 - 2022-12-30 - G06K9/62
  • 本发明提供一种双编码半监督非靶向食品污染物检测方法,包括:利用食品特征成分数据集,以半监督学习形式训练双编码半监督异常检测模型;该模型采用编码器‑解码器‑编码器结构,其中两个编码器结构相同,但网络参数不同,如此,训练过程中将产生两个隐含嵌入层;将两个隐含嵌入层特征之间的差异引入目标损失函数;对双编码半监督异常检测模型完成训练后,对待检测食品数据进行非靶向污染物检测。本发明可以学习到表示正常食品样本的稳定流形分布空间,放大食品正常样本和异常样本之间的异常得分差距,进而有效提高非靶向污染物检测性能。相比其他机器学习方法,本发明提高了对非靶向食品污染物检测的准确性。
  • 一种自动化识别网络质量状态的方法-202211162273.7
  • 朱东升;童义 - 国响(武汉)智能科技有限公司
  • 2022-09-23 - 2022-12-30 - G06K9/62
  • 本发明提出了一种自动化识别网络质量状态的方法,涉及网络质量状态识别领域,包括:采集网络数据,对有缺失的部分数据使用拉格朗日插值法,得到与原始数据同分布的数据集;采用主成分分析法对数据集进行降维处理,得到不损失原有数据集特征的精简数据集,构建权重矩阵、阈值矩阵和最终阈值值;基于权重矩阵和阈值矩阵构建生成器,对精简数据集进行打分和比较,将其划分为质差数据和非质差数据;基于全连接神经网络构建分类器,计算出质差数据和非质差数据之间的边界,得到新的阈值矩阵,并计算与前一个阈值矩阵的欧式距离,从而判断训练是否收敛稳定。本发明能够有效的识别并量化定位网络质量状态,为运维人员分析质差数据提供精确参考。
  • 生成对抗网络的高分辨率数据重构方法及相关方法和设备-202211249648.3
  • 段含婷;吕田田;张乐;吴艳芹 - 中国电信股份有限公司
  • 2022-10-12 - 2022-12-30 - G06K9/62
  • 本公开提供了一种生成对抗网络的高分辨率数据重构方法及相关方法和设备,涉及通信技术领域,该方法包括:输入特征信息至判别网络的胶囊网络结构,其中所述胶囊网络结构包括主胶囊层和数字胶囊层;在所述主胶囊层中运用多尺度卷积多路径跳跃残差连接的密集块,提取所述特征信息的不同空间特征信息,得到浅层胶囊信息;以及在所述数字胶囊层中使用动态路由算法将所述浅层胶囊信息激活映射到高层胶囊信息生成高分辨率重构的数据。本方法可以提高生成对抗网络的高分辨率数据重构的性能以及降低数据重构的计算量。
  • 数据样本生成方法、装置、计算机设备及存储介质-201910204429.5
  • 张晨斌;宾志豪;庄灿杰;曹誉仁;黄泽丰;倪晓臻;徐森圣;胡嘉琪;陈奋;黄伟旭 - 腾讯科技(深圳)有限公司
  • 2019-03-18 - 2022-12-30 - G06K9/62
  • 本申请是关于一种数据样本生成方法、装置、计算机设备及存储介质。该方法包括:获取终端的目标数据母本,目标数据母本中的每个数据单元对应输入过程的n个输入阶段中的一个,每个数据单元包括终端在对应输入阶段内采集到的传感器数据;将n个数据单元中的k个待替换数据单元,替换为从替换数据池中获取的k个替换数据单元,获得数据样本,每个替换数据单元包括其它终端在一个输入阶段采集到的传感器数据。本申请所示的方案结合输入过程中采集到的传感器数据的特性,提供了一种适用于以传感器数据为数据样本,在模型冷启动初期,针对少量的数据样本进行有效的样本增强的方案,进而提高模型冷启动初期的模型训练效果。
专利分类
×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

400-8765-105周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top