[发明专利]一种流量分类方法、装置、电子设备、介质及产品在审
| 申请号: | 202210070532.7 | 申请日: | 2022-01-21 |
| 公开(公告)号: | CN114490817A | 公开(公告)日: | 2022-05-13 |
| 发明(设计)人: | 段雪涛 | 申请(专利权)人: | 百度在线网络技术(北京)有限公司 |
| 主分类号: | G06F16/2458 | 分类号: | G06F16/2458;G06F16/26 |
| 代理公司: | 北京柏杉松知识产权代理事务所(普通合伙) 11413 | 代理人: | 马敬;项京 |
| 地址: | 100085 北京市*** | 国省代码: | 北京;11 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 流量 分类 方法 装置 电子设备 介质 产品 | ||
本公开提供了一种流量分类方法、装置、电子设备、介质及产品,涉及数据处理技术领域,尤其涉及大数据技术领域。可以实现按照流量的价值对流量分类。具体实现方案为:获取目标流量,然后获取目标流量的业务属性数据。并根据流量类型与成本消耗数据之间的预设对应关系,确定目标流量的类型对应的成本消耗数据,其中,成本消耗数据表示处理流量所需消耗的资源量。之后将业务属性数据和成本消耗数据输入预先训练的流量价值模型,获得流量价值模型输出的目标流量的价值类型。
技术领域
本公开涉及数据处理技术领域,尤其涉及大数据技术领域。
背景技术
对流量的分类,有利于对不同类型的流量做不同的处理。目前一般通过流量染色的方式,从业务维度对流量进行分类标记,并基于流量不同的标记做不同的处理。例如,基于业务维度对一部分流量进行流量染色,并对染色流量和未染色流量做不同的处理,以便从处理结果中得到实验效果。又例如,在灰度发布机制中,基于业务维度圈定一部分流量发布新版本,并观察新版本的效果,之后逐步推广新版本。
发明内容
本公开提供了一种用于流量分类方法、装置、电子设备、介质及产品。
本公开实施例的第一方面,提供了一种流量分类方法,包括:
获取目标流量;
获取所述目标流量的业务属性数据;
根据流量类型与成本消耗数据之间的预设对应关系,确定所述目标流量的类型对应的成本消耗数据,成本消耗数据表示处理流量所需消耗的资源量;
将所述业务属性数据和所述成本消耗数据输入预先训练的流量价值模型,获得所述流量价值模型输出的所述目标流量的价值类型。
可选的,所述流量价值模型通过以下方式训练获得:
获取样本训练集,所述样本训练集包括多个样本流量的业务属性数据和成本消耗数据,以及每个样本流量的训练标签;
将样本流量的业务属性数据和成本消耗数据输入流量价值模型,得到所述流量价值模型输出的样本流量的价值类型;
基于所述流量价值模型输出的样本流量的价值类型和样本流量的训练标签,确定所述流量价值模型是否收敛;
若所述流量价值模型未收敛,则调整所述流量价值模型的模型参数,并返回所述将样本流量的业务属性数据和成本消耗数据输入流量价值模型的步骤;
若所述流量价值模型收敛,则确定所述流量价值模型训练完成。
可选的,所述获取样本训练集,包括:
针对每个样本流量,获取该样本流量的业务属性数据、成本消耗数据和业务价值数据,业务价值数据表示处理流量所能带来的收益;
根据该样本流量的业务价值数据,生成该样本流量的训练标签。
可选的,所述针对每个样本流量,获取该样本流量的业务属性数据、成本消耗数据和业务价值数据,包括:
接收代理Agent发送的样本流量的相关数据,所述相关数据包括业务属性数据、成本消耗数据和/或业务价值数据;所述Agent用于从处理样本流量的业务模块中,拉取样本流量的相关数据;和/或,
接收轮询polling服务器发送的样本流量的相关数据,所述polling服务器用于以轮询的方式,向所述业务模块请求获取样本流量的相关数据。
可选的,所述价值类型包括高价值和低价值;在所述获得所述流量价值模型输出的所述目标流量的价值类型之后,所述方法还包括:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于百度在线网络技术(北京)有限公司,未经百度在线网络技术(北京)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210070532.7/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种电能表检测一体式装置
- 下一篇:一种会计传票票据自动盖章设备





