[发明专利]一种基于贝叶斯分类的行业编码选定方法在审
| 申请号: | 202210973020.1 | 申请日: | 2022-08-15 |
| 公开(公告)号: | CN115358309A | 公开(公告)日: | 2022-11-18 |
| 发明(设计)人: | 郑清正 | 申请(专利权)人: | 江苏苏宁银行股份有限公司 |
| 主分类号: | G06K9/62 | 分类号: | G06K9/62;G06F16/2457;G06F16/248;G06V30/416;G06V30/42;G06Q40/02 |
| 代理公司: | 南京瑞华腾知识产权代理事务所(普通合伙) 32368 | 代理人: | 徐冲冲 |
| 地址: | 210000 江苏*** | 国省代码: | 江苏;32 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 基于 贝叶斯 分类 行业 编码 选定 方法 | ||
本发明公开了一种基于贝叶斯分类的行业编码选定方法。该方法包括获取用户提交的相关申请资料;从申请资料中提取企业的基本信息;判断企业是否为新的行业客户,是则列举出该企业经营范围内的所有行业,由客户选定所属行业,否则,通过对企业经营范围的内容解析,识别出企业经营范围数据集,并给出最大概率的四级行业编码推荐数据选项;若四级行业编码推荐数据选项不被用户认可,扩大推荐范围至选定确认成功,或由客户对系统推荐的行业编码进行校验确认,无误则落库存储。本发明解决了跨行业经营的企业的主行业分类计算问题和存量历史数据的校验和修复问题,提升客户对行业编码的定位效率和准确度,逐步提升对新客群的行业编码分类能力。
技术领域
本发明涉及基于贝叶斯分类的行业编码选定方法技术领域,具体涉及一种基于贝叶斯分类的行业编码选定方法。
背景技术
我国银行业金融机构承担定期向国家金融监管部门报送的责任。而随着政府部门对监管报送的内容的准确性要求越来越高,各银行机构需要投入在监管报送数据校验工作上的人力和物力愈来愈重。由于数据源的加工处理过程来源复杂,且加工逻辑不一,在汇总成综合报表后,容易出现数据不一致,或数据不准确的问题。
监管报送数据处理中,涉及企业经营类数据的报送内容有“经营范围”和“所属行业”两个维度的数据。其中“经营范围”属于多种并列关系数据,即一个企业的经营范围可能较为广阔,横跨多个“行业”。但是企业的“所属行业”又只能填写一个,部分系统数据填写又由于引入人工填写的内容,容易造成企业“经营范围”和“所属行业”不匹配的问题。
实际发生数据不一致问题时,如果数据规模较小,可手动调整,但是如果涉及数据过大,手动的人工调整存在风险,且不能从根本上解决数据不一致的问题。再者,其数据修复所耗时间长,涉及人工修复成本高,不利于后续的数据运营管理。
发明内容
本发明的目的是针对现有技术存在的不足,提供一种基于贝叶斯分类的行业编码选定方法。
为实现上述目的,本发明提供了一种基于贝叶斯分类的行业编码选定方法,包括:
步骤1、获取用户在申请相关业务时提交的相关申请资料;
步骤2、从所述申请资料中提取企业的基本信息;
步骤3、基于提取的企业的基本信息判断所述企业是否为新的行业客户,若为新的行业客户,则跳转至步骤6,否则,进入步骤4;
步骤4、通过对企业经营范围的内容解析,识别出企业经营范围数据集,并给出最大概率的四级行业编码推荐数据选项;
步骤5、若所述四级行业编码推荐数据选项不被用户认可,则基于企业的经营范围,给出过滤后的概率最高的A个四级行业编码推荐数据选项供客户选择,若仍未被用户认可,则回退至三级行业编码推荐数据选项供客户选择,若仍未被用户认可,则由用户选择继续回退直至选定确认成功或跳转至步骤6;
步骤6、若为新的行业客户,则列举出该企业经营范围内的所有行业,由客户选定所属行业,否则由客户对系统推荐的行业编码进行校验确认;
步骤7、用户确认选定或校验确认的行业编码无误后,通过整个业务办理流程后落库存储。
进一步的,所述申请资料包括营业执照,所述步骤2基于OCR解析营业执照内容。
进一步的,所述步骤4具体包括:
将当前历史数据中的每条经营范围记录作数据清洗提取后,统计第i种经营范围记录ri在行内的指定类别细项的统计数量计算第i种经营范围记录ri在当前数据集下的先验概率p(ri)为:
其中,M代表经营记录细项的总数;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于江苏苏宁银行股份有限公司,未经江苏苏宁银行股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210973020.1/2.html,转载请声明来源钻瓜专利网。
- 上一篇:增湿器储存器
- 下一篇:一种基于纬编织平针组织金属骨架的复合管材及制备方法





