[发明专利]一种基于模型进行预测的方法和装置有效

专利信息
申请号: 201811522364.0 申请日: 2018-12-13
公开(公告)号: CN110033091B 公开(公告)日: 2020-09-01
发明(设计)人: 刘永超;李思仲;潘国振;徐建国;黄启印 申请(专利权)人: 阿里巴巴集团控股有限公司
主分类号: G06N20/00 分类号: G06N20/00
代理公司: 北京博思佳知识产权代理有限公司 11415 代理人: 林祥
地址: 英属开曼群岛大开*** 国省代码: 暂无信息
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 基于 模型 进行 预测 方法 装置
【说明书】:

本说明书实施例提供一种基于模型进行预测的方法和装置,其中,所述方法包括:模型运行环境接收所述机器学习模型的输入张量;模型运行环境向嵌入运行环境发送查表请求,所述查表请求中携带所述输入张量,以请求对所述输入张量进行低维转换;模型运行环境接收嵌入运行环境返回的查表结果,所述查表结果由所述嵌入运行环境根据所述输入张量进行嵌入查询和处理得到;模型运行环境将所述查表结果输入机器学习模型,并运行所述机器学习模型完成基于模型进行预测。

技术领域

本公开涉及机器学习技术领域,特别涉及一种基于模型进行预测的方法和装置。

背景技术

在人工智能中,特征工程是一个非常重要的环节。特征工程是将机器学习模型的输入数据转换为特征向量的过程,是机器学习中重要的起始步骤。而嵌入(embedding)是特征工程中的一种数据转换方法,机器学习的输入数据可能是一个高维张量,可以通过嵌入层将高维张量映射到低维的连续空间,达到特征提取的目的。通过将高维空间映射到嵌入这种低维空间,使得在大型输入(典型的是高维度稀疏张量)上的机器学习变得更加容易。

但是,嵌入层的参数量通常非常大,在某些业务场景中,所有嵌入层参数的内存总量可以达到千亿级别(比如100GB~1TB内存)。这种情况对实时在线模型的部署和预测构成很大的挑战:单台机器不能提供足够的共享内存去存储整个模型,因此需要购买定制的机器提供服务,增加了设备购置、运行和维护的成本;并且,单台机器的容量被较大的嵌入层占用,也使得模型运行不能充分发挥底层硬件资源的计算能力,造成资源浪费。

发明内容

有鉴于此,本说明书一个或多个实施例提供一种基于模型进行预测的方法和装置,以降低模型运行成本,且更好的发挥资源能力。

具体地,本说明书一个或多个实施例是通过如下技术方案实现的:

第一方面,提供一种基于模型进行预测的方法,所述方法由机器学习模型系统执行,所述系统包括:机器学习模型、以及用于对机器学习模型的输入张量进行转换的嵌入模型;所述嵌入模型和机器学习模型分开部署,嵌入模型部署在嵌入运行环境,所述机器学习模型部署在模型运行环境中;所述方法包括:

所述模型运行环境接收所述机器学习模型的输入张量;

所述模型运行环境向嵌入运行环境发送查表请求,所述查表请求中携带所述输入张量,以请求对所述输入张量进行低维转换;

所述模型运行环境接收嵌入运行环境返回的查表结果,所述查表结果由所述嵌入运行环境根据所述输入张量进行嵌入查询和处理得到;

所述模型运行环境将所述查表结果输入机器学习模型,并运行所述机器学习模型完成基于模型进行预测。

第二方面,提供一种机器学习模型系统,所述系统包括:嵌入运行环境和模型运行环境,所述嵌入运行环境中部署嵌入模型,所述模型运行环境中部署机器学习模型;

所述模型运行环境,用于接收所述机器学习模型的输入张量;并用于向嵌入运行环境发送查表请求,所述查表请求中携带所述输入张量,以请求对所述输入张量进行低维转换;还用于将所述查表结果输入机器学习模型,并运行所述机器学习模型完成基于模型进行预测;

所述嵌入运行环境,用于根据查表请求,对所述输入张量进行嵌入查询和处理得到查表结果,并将所述查表结果反馈给所述模型运行环境。

第三方面,提供一种基于模型进行预测的设备,所述设备包括存储器、处理器,以及存储在存储器上并可在处理器上运行的计算机指令,所述处理器执行指令时以实现嵌入运行环境和模型运行环境,所述嵌入运行环境用于运行嵌入模型,所述模型运行环境用于运行机器学习模型;所述处理器执行指令用于实现以下步骤:

所述模型运行环境接收所述机器学习模型的输入张量;

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于阿里巴巴集团控股有限公司,未经阿里巴巴集团控股有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201811522364.0/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top