[发明专利]一种数据处理方法及装置在审
| 申请号: | 202010108589.2 | 申请日: | 2020-02-21 |
| 公开(公告)号: | CN111428963A | 公开(公告)日: | 2020-07-17 |
| 发明(设计)人: | 孙继安 | 申请(专利权)人: | 贝壳技术有限公司 |
| 主分类号: | G06Q10/06 | 分类号: | G06Q10/06;G06K9/62 |
| 代理公司: | 北京路浩知识产权代理有限公司 11002 | 代理人: | 苗晓静 |
| 地址: | 300457 天津市滨海新区经济技术开发*** | 国省代码: | 天津;12 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 数据处理 方法 装置 | ||
1.一种数据处理方法,其特征在于,包括:
对第一类型人员的预设时间内的第一业务数据进行统计得到包含预设的特征项的第一统计数据,由所述第一统计数据构成正向特征库;对第二类型人员的所述预设时间内的第二业务数据进行统计得到包含所述特征项的第二统计数据,由所述第二统计数据构成负向特征库;其中,所述第一类型人员为业绩排名靠前预设第一比例的人员,所述第二类型人员为业绩排名靠后预设第二比例的人员;
根据所述正向特征库和所述负向特征库构建朴素贝叶斯分类器;其中,所述第一统计数据属于正向类别,所述第二统计数据属于负向类别;
对待测试人员的业务数据进行处理后得到包含所述特征项的特征数据,将所述特征数据输入到所述朴素贝叶斯分类器,获取所述特征数据的分类结果;
若所述特征数据属于所述负向类别,则获取所述特征数据与所述正向特征库中数据的差距信息,并将所述差距信息发送给与所述待测试人员对应的终端。
2.根据权利要求1所述的数据处理方法,其特征在于,所述预设的特征项包括:
业务流量、与用户沟通次数、作业平台在线时长、获取用户联系方式条数、预设等待时间以内未回复用户次数、骚扰用户次数及丢单次数中的至少一项。
3.根据权利要求1所述的数据处理方法,其特征在于,所述根据所述正向特征库和所述负向特征库构建朴素贝叶斯分类器,包括:
划分所述特征项的取值区间;
根据所述正向特征库和所述负向特征库,计算所述正向类别的第一概率以及所述负向类别的第二概率;
计算在所述正向类别条件下各个所述取值区间的第三概率以及在所述负向类别条件下各个所述取值区间的第四概率;
根据所述第一概率、所述第二概率、所述第三概率及所述第四概率获取用于划分所述特征数据属于所述正向类别或属于所述负向类别的所述朴素贝叶斯分类器。
4.根据权利要求3所述的数据处理方法,其特征在于,所述将所述特征数据输入到所述朴素贝叶斯分类器,获取所述特征数据的分类结果,包括:
获取所述特征数据中各个所述特征项所归属的所述取值区间;
根据各个所述取值区间,分别获取所述正向类别条件下各个所述取值区间对应的所述第三概率以及所述负向类别条件下各个所述取值区间对应的所述第四概率;
根据所述第一概率与各个所述第三概率的乘积获取所述特征数据条件下为所述正向类别的第五概率;根据所述第二概率与各个所述第四概率的乘积获取所述特征数据条件下为所述负向类别的第六概率;
若所述第五概率大于所述第六概率,则所述特征数据属于所述正向类别;否则,所述特征数据属于所述负向类别。
5.根据权利要求1所述的数据处理方法,其特征在于,所述特征数据与所述正向特征库中数据的差距信息为所述特征数据中的所述特征项与所述第一统计数据中相应的所述特征项的均值的差距信息;在所述将所述差距信息发送给与所述待测试人员对应的终端之前,所述方法还包括:
设置与每个所述特征项对应的提醒触发方式,所述提醒触发方式包括单条触发方式和/或基于预设时间窗口触发方式;若满足所述提醒触发方式的触发条件,则再执行所述将所述差距信息发送给与所述待测试人员对应的终端;
其中,对于设置为所述单条触发方式的所述特征项,则若所述特征数据与所述第一统计数据关于所述特征项存在预设差距情形即提醒;对于设置为所述基于预设时间窗口触发方式的所述特征项,则若所述特征数据与所述第一统计数据关于所述特征项出现所述预设差距情形的次数超过预设次数或出现所述预设差距情形的比例超过预设比例即提醒。
6.根据权利要求1所述的数据处理方法,其特征在于,所述将所述差距信息发送给与所述待测试人员对应的终端,包括:通过微信、短信或电话中的至少一种将所述差距信息发送给与所述待测试人员对应的终端。
7.根据权利要求1所述的数据处理方法,其特征在于,所述方法还包括:
通过积累的业务数据不断更新迭代所述朴素贝叶斯分类器。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于贝壳技术有限公司,未经贝壳技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010108589.2/1.html,转载请声明来源钻瓜专利网。
- 同类专利
- 专利分类
G06Q 专门适用于行政、商业、金融、管理、监督或预测目的的数据处理系统或方法;其他类目不包含的专门适用于行政、商业、金融、管理、监督或预测目的的处理系统或方法
G06Q10-00 行政;管理
G06Q10-02 .预定,例如用于门票、服务或事件的
G06Q10-04 .预测或优化,例如线性规划、“旅行商问题”或“下料问题”
G06Q10-06 .资源、工作流、人员或项目管理,例如组织、规划、调度或分配时间、人员或机器资源;企业规划;组织模型
G06Q10-08 .物流,例如仓储、装货、配送或运输;存货或库存管理,例如订货、采购或平衡订单
G06Q10-10 .办公自动化,例如电子邮件或群件的计算机辅助管理





