[发明专利]基于不规则数据计算推荐金额的方法及系统在审
申请号: | 202010052545.2 | 申请日: | 2020-01-17 |
公开(公告)号: | CN111275523A | 公开(公告)日: | 2020-06-12 |
发明(设计)人: | 赵旺;李昭;陈浩;高靖;崔岩;卢述奇;陈呈;张宵 | 申请(专利权)人: | 青梧桐有限责任公司 |
主分类号: | G06Q30/06 | 分类号: | G06Q30/06 |
代理公司: | 北京晟睿智杰知识产权代理事务所(特殊普通合伙) 11603 | 代理人: | 于淼 |
地址: | 200241 上海市*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 不规则 数据 计算 推荐 金额 方法 系统 | ||
本申请公开了一种基于不规则数据计算推荐金额的方法及系统,涉及数据处理领域,包括:将订单信息、客户信息、商品信息作为变量,对变量与赔付金额进行相关性分析,将影响赔付金额的变量作为自变量,根据自变量确定自变量组合;对连续数值型的自变量进行离散化,形成多个区间;设置支持度和置信度,通过支持度和置信度对各区间进行频繁项集挖掘,并确定区间的备选推荐金额;设计目标函数,将使目标函数的值最小的备选推荐金额作为区间的最优推荐金额。本申请综合考虑自变量信息得到稳定性较高的目标函数,可以输出具有业务可解释性的合理推荐金额,而且能有效避免分类模型中召回率与精准率不可兼得的问题,可以使用与多种场合。
技术领域
本申请涉及数据处理领域,具体地说,涉及一种基于不规则数据计算推荐金额的方法及系统。
背景技术
随着计算机的飞速发展,数据的来源越来越多样,覆盖的范围越来越广泛,因此,如何从海量的、模糊的和不完全的数据中提取有用的信息是科研者一直以来的追求。
在进行赔付金额的设定时,大多是通过回归预测模型进行设定,现有的回归预测模型有根据业务经验设定推荐金额、局部加权线性回归和分类模型等。根据业务经验设定大多是通过业务经验设定推荐金额,主要依赖于业务人员的业务经验,科学性差,而且主要依赖于人力,当变量组合较多时,会耗费很大的人力,且计算效率很低。局部加权线性回归虽然有一定的科学性,但局部加权线性回归方法是基于数值型数据进行处理,而进行推荐金额设定时,自变量中存在不少标称型数据,将标称型数据转换为数值型数据是一个难题。此外,局部加权线性回归的输出仍然接近于平滑的连续性数据,与实际业务场景中的数据仍然有较大差别,业务可解释性差。使用分类模型时,通过合理的构建特征虽然可以提高精度,但其存在召回率与精准率不能兼得的问题,因此,在进行赔付金额的设定时,分类模型并不实用。
发明内容
有鉴于此,本申请提供了一种基于不规则数据计算推荐金额的方法及系统,综合考虑自变量信息得到稳定性较高的目标函数,可以输出具有业务可解释性的合理推荐金额,而且能有效避免分类模型中召回率与精准率不可兼得的问题,可以使用与多种场合。
为了解决上述技术问题,本申请有如下技术方案:
第一方面,本申请提供一种基于不规则数据计算推荐金额的方法,包括:
采集订单信息、客户信息、商品信息和赔付金额,将所述订单信息、客户信息、商品信息作为变量,对所述变量与赔付金额进行相关性分析,将影响所述赔付金额的变量作为自变量,根据所述自变量确定自变量组合;
对所述自变量组合中数值类型为连续数值型的自变量进行离散化,形成多个区间;
设置支持度和置信度,通过所述支持度和置信度对各所述区间进行频繁项集挖掘;
计算所述区间中各自变量的均值、中位数、众数和上下四分位数;
根据所述均值、所述中位数、所述众数、所述上下四分位数和所述频繁项集形成所述区间的备选推荐金额;
设计目标函数为cost=eλcost_a+ecost_b,其中,λ表示平滑系数,cost_a表示赔付成本的提升率,cost_b表示满意度偏移量;
利用所述目标函数遍历所述区间内的备选推荐金额,将使所述目标函数的值最小的所述备选推荐金额作为所述区间的最优推荐金额。
可选地,其中:
所述对所述变量与赔付金额进行相关性分析,具体为:采用联列表分析方法或假设检验分析方法分别对所述订单信息、客户信息、商品信息与赔付金额进行相关性分析。
可选地,其中:
筛选不存在频繁项集的区间作为第一区间,利用与所述第一区间相邻区间的备选推荐金额作为所述第一区间的备选推荐金额。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于青梧桐有限责任公司,未经青梧桐有限责任公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010052545.2/2.html,转载请声明来源钻瓜专利网。
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置