[发明专利]数据排序方法及装置有效
申请号: | 202111624648.2 | 申请日: | 2021-12-28 |
公开(公告)号: | CN114490786B | 公开(公告)日: | 2023-01-31 |
发明(设计)人: | 陈实;李宽;王洪斌;蒋宁;吴海英 | 申请(专利权)人: | 马上消费金融股份有限公司 |
主分类号: | G06F16/2457 | 分类号: | G06F16/2457;G06F16/28;G06N20/00 |
代理公司: | 北京国昊天诚知识产权代理有限公司 11315 | 代理人: | 张敏 |
地址: | 401120 重庆市渝北区*** | 国省代码: | 重庆;50 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 数据 排序 方法 装置 | ||
本申请实施例提供了一种数据排序方法及装置,在各特征维度下的目标特征类别对应的多个线上业务数据中,分别选取第一数量的线上业务数据,再将选取的线上业务数据输入排序模型,得到相应的排序结果,并基于排序结果确定第二数量的待处理的目标业务事件,即在每个特征维度的目标特征类别下选取输入至排序模型的线上业务数据,由于目标特征类别对应的目标精确率满足预设条件,且目标精确率能够表征在第一数量中预测正确的正样本的数量占比,因此在多个特征维度的目标特征类别下选取一定数量的线上业务数据,这样能够确保选取出更多的正样本,从而确保输入至排序模型的第二业务数据集中的正负样本的数量更加均衡,进而提升排序模型的topN精确率。
技术领域
本申请涉及人工智能技术领域,尤其涉及一种数据排序方法及装置。
背景技术
目前,随着机器学习技术的快速发展,机器学习在许多业务场景中得到了广泛的使用。业务提供方可以通过采集业务场景下的用户数据训练机器学习模型,使得业务提供方能够利用训练的机器学习模型预测用户的行为,从而为用户提供更优质的服务。
其中,针对一些特定的业务场景,例如投诉场景,可以利用排序模型对有可能投诉的用户进行预测,但是由于人力资源有限,每天只能处理一定数量的用户的诉求,因此,需要提供一种能够使排序模型的预测结果更加准确的技术方案。
发明内容
本申请实施例提供的一种数据排序方法及装置,能够确保选取出更多的正样本,从而确保输入至排序模型的第二业务数据集中的正负样本的数量更加均衡,进而提升排序模型的topN精确率,这样在一些特定的业务场景下,利用训练的排序模型对业务数据进行预测时,能够使排序靠前的预测结果中包含更多的正样本,进而使排序模型的预测结果更加准确。
为了实现上述技术方案,本申请实施例是这样实现的:
第一方面,本申请实施例提供的一种数据排序方法,所述方法包括:
获取目标业务的第一业务数据集;其中,所述第一业务数据集包括多个线上业务数据,每个所述线上业务数据包括多个特征维度,每个所述特征维度包括多个特征类别;
针对每个所述特征维度,在所述特征维度的目标特征类别下的多个所述线上业务数据中,选取第一数量的线上业务数据;其中,所述目标特征类别是每个所述特征维度的所述多个特征类别中目标精确率满足预设条件的特征类别,每个所述特征类别对应于一个所述目标精确率,所述目标精确率用于表征在所述第一数量中预测正确的正样本的数量占比;
基于所述第一数量的线上业务数据,确定第二业务数据集;
将所述第二业务数据集输入预先训练的排序模型中,得到所述线上业务数据的排序结果;
基于所述排序结果选取第二数量的线上业务数据对应的业务事件作为待处理的目标业务事件。
第二方面,本申请实施例提供的一种数据排序装置,所述装置包括:
第一获取模块,用于获取目标业务的第一业务数据集;其中,所述第一业务数据集包括多个线上业务数据,每个所述线上业务数据包括多个特征维度,每个所述特征维度包括多个特征类别;
第一选取模块,用于针对每个所述特征维度,在所述特征维度的目标特征类别下的多个所述线上业务数据中,选取第一数量的线上业务数据;其中,所述目标特征类别是每个所述特征维度的所述多个特征类别中目标精确率满足预设条件的特征类别,每个所述特征类别对应于一个所述目标精确率,所述目标精确率用于表征在所述第一数量中预测正确的正样本的数量占比;
第一确定模块,用于基于所述第一数量的线上业务数据,确定第二业务数据集;
排序模块,用于将所述第二业务数据集输入预先训练的排序模型中,得到所述线上业务数据的排序结果;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于马上消费金融股份有限公司,未经马上消费金融股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111624648.2/2.html,转载请声明来源钻瓜专利网。
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置