[发明专利]一种基于大数据的信息管理系统与方法有效

专利信息
申请号: 202111269878.1 申请日: 2021-10-29
公开(公告)号: CN113703986B 公开(公告)日: 2022-03-11
发明(设计)人: 陈玉才;孙海涛;徐硕 申请(专利权)人: 苏州优鲜信网络生活服务科技有限公司
主分类号: G06F9/50 分类号: G06F9/50;G06N20/00
代理公司: 北京君莫知识产权代理事务所(普通合伙) 11715 代理人: 崔云鹤
地址: 215000 江苏省苏*** 国省代码: 江苏;32
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 基于 数据 信息管理 系统 方法
【说明书】:

发明提出基于大数据的信息管理方法,包括如下步骤:获取输入数据流,将图像属性数据和文本属性数据按照数据产生时序执行关联,获得多组关联数据流;将当前关联数据流作为深度学习模型的输入;当输出结果满足第一性能条件时,启动第一显存分配进程分配第一显存空间,将下一个关联数据流存贮至第一显存空间;当第一显存空间的显存占用率超过预设的显存容量控制阈值时,启动第二显存分配进程分配第二显存空间,将下一个关联数据流存贮至第二显存空间;判断已经分配的显存空间的总容量是否超过系统控制值,如果是,则将已经分配的显存空间的目标关联数据转移至内存组件。本发明还公开实现所述方法的系统与计算机可读存储介质。

技术领域

本发明属于大数据信息管理领域,尤其涉及一种基于大数据的信息管理方法以及实现所述方法的系统、计算机可读存储介质。

背景技术

在数据膨胀的当今社会里,海量数据中蕴含价值日渐凸显出来。如何有效的挖掘海量数据中的有效信息已经成为各个领域面临的共同问题。以互联网企业为代表的科技公司依据自身的实际需求,开始大量的应用机器学习、数据挖掘以及人工智能等算法获取海量数据中蕴含的信息,并且已经取得了很好的效果。当今社会已经从过去的信息匮乏,转变为信息泛滥的时代。由于网络以及相关应用的不断普及,网络数据逐渐呈现着“海量、高维”的趋势,如何利用已有的机器学习或者数据挖掘的算法,获取有效信息,已经成为学术界以及工业所共同关注的重点。

利用深度学习自动学习特征已经逐步取代了人工构建特征和统计方法。但其中一个关键问题是需要大量的数据,否则会因为参数过多过拟合。但是这个成本非常高昂,因此从海量的大数据流中获取有限数据训练高效的深度学习模型成为需要解决的问题。一个重要的里程碑是转移学习——受人类启发,不是从大量数据中从头开始学习,而是利用少量样例来解决问题。

经检索现有技术,CN111327692A提出一种模型训练方法,在硬件方面,通过将控制节点和至少一个计算节点通过网络互连,在计算节点中引入GPU作为计算资源,从而大幅度提升集群系统的硬件能力,进而提升模型训练的效率。软件方面,通过对slurm框架进行优化,引入客户端、超级管理平台等,使得集群系统用起来更方便;CN112416585A提出一种面向深度学习的GPU资源管理与智能化调度方法,包括以下步骤:第一步,用户通过前端接口组件提交深度学习作业,包括待执行的深度学习程序与训练数据集;第二步,在进行验证后将作业添加到调度器对应的待调度队列;第三步,为该作业启动独立的作业管理器;第四步,向资源管理器申请作业运行需要的计算资源;第五步,对待调度作业进行特征建模与分析;第六步,根据作业特征与集群计算节点特征生成资源调度方案;第七步,按照调度方案将作业调度到指定计算节点上;第八步,作业执行器启动容器并执行深度学习程序。该发明可解决现有集群资源调度方法在深度学习场景下GPU资源利用率低、作业执行性能差的问题。

然而,现有技术均未解决如何从海量大数据流中获取有效关联数据作为训练数据,并将数据执行对应关联便于后续存储读取的问题。

发明内容

为解决上述技术问题,本发明提出一种基于大数据的信息管理方法以及实现所述方法的系统、计算机可读存储介质。

在本发明的第一个方面,提出一种基于大数据的信息管理方法,所述方法包括如下步骤:

获取输入数据流,所述输入数据流包括图像属性数据和文本属性数据;

将所述输入数据流中的图像属性数据和文本属性数据按照数据产生时序执行关联,获得多组关联数据流;

将当前关联数据流作为深度学习模型的输入;

当所述深度学习模型的输出结果满足第一性能条件时,启动第一显存分配进程分配第一显存空间,将下一个关联数据流存贮至第一显存空间;

当所述深度学习模型的输出结果不满足第一性能条件,抛弃当前关联数据流,将下一个关联数据流作为当前数据流。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于苏州优鲜信网络生活服务科技有限公司,未经苏州优鲜信网络生活服务科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202111269878.1/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top