[发明专利]一种基于银行数据的外出务工人员识别方法、设备及介质在审
申请号: | 202011237043.3 | 申请日: | 2020-11-09 |
公开(公告)号: | CN112308705A | 公开(公告)日: | 2021-02-02 |
发明(设计)人: | 尹卓英;龙军 | 申请(专利权)人: | 中南大学 |
主分类号: | G06Q40/02 | 分类号: | G06Q40/02;G06Q30/02;G06K9/62;G06N20/20 |
代理公司: | 长沙市融智专利事务所(普通合伙) 43114 | 代理人: | 熊开兰 |
地址: | 410083 湖南*** | 国省代码: | 湖南;43 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 银行 数据 外出 务工人员 识别 方法 设备 介质 | ||
本发明公开了一种基于银行数据的外出务工人员识别方法、设备及介质,其中方法为:获取银行的大量客户数据,从中提取与外出标签关联的客户特征并作为样本的特征向量,以开户登记的外出标签作为样本标签,构建弱监督样本集;从弱监督样本集中选择部分样本,通过人工验证的结果作为样本标签,构建强监督样本集;构建分类模型,利用弱监督样本集和强监督样本集对分类模型进行训练,得到外出务工识别模型;对待识别客户,从其客户数据中提取客户特征,将客户特征输入至外出务工识别模型,输出得到待识别客户是否为外出务工人员。本发明划分强弱监督集,降低训练样本的获取难度,保证样本的多样性,提升识别模型的泛化性能,且识别准确率高。
技术领域
本发明涉及银行特定客户群体识别技术领域,特别是指一种基于银行数据的外出务工人员识别方法、设备及介质。
背景技术
随着金融行业相关技术的发展,金融行业正发生着巨变。伴随着消费金融和互联网金融等新兴金融公司的兴起,商业银行面临着严峻的挑战。同时,由于各个商业银行的经营模式逐步完善,使得银行间的业务水平的差异也逐渐减小,各家银行逐步趋于同质化,根据银行自己客户的特点定制相关的营销策略,是在日益激烈的竞争中取得胜利的重要一环。
贵州是劳务输出大省,在对外出务工人员的服务上,贵州农信做出了巨大的努力和贡献,为农民工提供金融知识、致富信息和维权帮助,给予农民工群体最大的关怀。而准确、有效地识别出农民工群体,对后续的服务、精准营销有很大的帮助。
在外出务工人群的识别中,传统的方法是借助开户登记系统,在客户首次与银行接触的时候,显示为其添加外出标签,而由于人群的流动、以及标签时效的不确定性,导致此类标签的准确率随时间的变化大打折扣;此外通过业务人员的电话问询、回访的方式可以纠正部分标签,但由于投入成本过大,此方法不适合大规模、周期性进行;再者是通过专家规则进行识别,此方法能取得一定的成果,但由于规则往往受限于主观认知,且部分规则难于实现“可计算化”,因此仅能有限的识别目标群体,同时随着时间的发展,后续还需耗费人力更新、维护专家规则,以保持其有效性。
上述方法在外出务工人群的识别中效率和准确率都得不到保障。目前利用机器学习的方法,提取客户的特征数据,结合得到准确性保障的样本数据,通过监督学习的算法,自动学习出识别规则,以识别目标群体。但能否准确有效地识别、以及学习到的规则是否具有泛化性,往往取决于如何提取客户的特征、以及能否获取准确的训练样本。同时将银行客户按照资产、偏好与负债等属性进行划分,是大多数银行的管理模式,然而商业银行客户数据通常具有高维复杂性,使得选择特征的困难程度也会随之增长。同时开户时记录的标签的准确性得不到保障,通过人工调查的方式获取大量准确的样本标签,会产生很大的成本,获取的样本量过少又会导致学习出的模型有较大方差、泛化性低下,如何在尽可能少的成本下获取满足学习算法需要的样本充满了挑战。
发明内容
本发明的目的是提供一种基于银行数据的外出务工人员识别方法、设备及介质,以尽可能低的成本取得外出务工人员的识别模型,并且拥有较高的准确性和泛化性。
为实现上述技术目的,本发明采用如下技术方案:
一种基于置信学习的外出务工人员识别方法,包括以下步骤:
步骤1,构建监督样本集;
获取银行的大量客户数据,从中提取与外出标签关联的客户特征并作为样本的特征向量,以开户登记的外出标签作为样本标签,构建弱监督样本集WD;
从弱监督样本集中选择部分样本,通过人工验证对应客户是否外出,并以验证的结果作为样本标签,构建强监督样本集SD;
步骤2,构建分类模型,利用弱监督样本集WD和强监督样本集SD对分类模型进行训练,得到外出务工识别模型;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中南大学,未经中南大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011237043.3/2.html,转载请声明来源钻瓜专利网。
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置