[发明专利]一种基于贝叶斯分类的行业编码选定方法在审
| 申请号: | 202210973020.1 | 申请日: | 2022-08-15 |
| 公开(公告)号: | CN115358309A | 公开(公告)日: | 2022-11-18 |
| 发明(设计)人: | 郑清正 | 申请(专利权)人: | 江苏苏宁银行股份有限公司 |
| 主分类号: | G06K9/62 | 分类号: | G06K9/62;G06F16/2457;G06F16/248;G06V30/416;G06V30/42;G06Q40/02 |
| 代理公司: | 南京瑞华腾知识产权代理事务所(普通合伙) 32368 | 代理人: | 徐冲冲 |
| 地址: | 210000 江苏*** | 国省代码: | 江苏;32 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 基于 贝叶斯 分类 行业 编码 选定 方法 | ||
1.一种基于贝叶斯分类的行业编码选定方法,其特征在于,包括:
步骤1、获取用户在申请相关业务时提交的相关申请资料;
步骤2、从所述申请资料中提取企业的基本信息;
步骤3、基于提取的企业的基本信息判断所述企业是否为新的行业客户,若为新的行业客户,则跳转至步骤6,否则,进入步骤4;
步骤4、通过对企业经营范围的内容解析,识别出企业经营范围数据集,并给出最大概率的四级行业编码推荐数据选项;
步骤5、若所述四级行业编码推荐数据选项不被用户认可,则基于企业的经营范围,给出过滤后的概率最高的A个四级行业编码推荐数据选项供客户选择,若仍未被用户认可,则回退至三级行业编码推荐数据选项供客户选择,若仍未被用户认可,则由用户选择继续回退直至选定确认成功或跳转至步骤6;
步骤6、若为新的行业客户,则列举出该企业经营范围内的所有行业,由客户选定所属行业,否则由客户对系统推荐的行业编码进行校验确认;
步骤7、用户确认选定或校验确认的行业编码无误后,通过整个业务办理流程后落库存储。
2.根据权利要求1所述的一种基于贝叶斯分类的行业编码选定方法,其特征在于,所述申请资料包括营业执照,所述步骤2基于OCR解析营业执照内容。
3.根据权利要求1所述的一种基于贝叶斯分类的行业编码选定方法,其特征在于,所述步骤4具体包括:
将当前历史数据中的每条经营范围记录作数据清洗提取后,统计第i种经营范围记录ri在行内的指定类别细项的统计数量计算第i种经营范围记录ri在当前数据集下的先验概率p(ri)为:
其中,M代表经营记录细项的总数;
统计当前历史数据中的每个经营四级行业编码的数量,将出现的频率映射为四级分类编码的概率,具体如下:
其中,N代表四级行业编码的总数,代表第i种行业编码hi在当前数据集的出现次数;
根据企业经营范围的内容解析结果给定所述企业的经营范围r1,r2,…,rn,其中,n为大于2的自然数;
在行业编码固定的情况下,计算当前给定的经营范围r1,r2,...,rn的条件概率p(rj|hi),其中j∈[1,...,n];
根据当前给定的经营范围r1,r2,...,rn的条件概率p(rj|hi)计算行业编码的概率p(hi|r1,r2,...,rn),具体如下:
其中,p(r1,r2,...,rn|hi)为在确认行业编码为hi的情况下,r1,r2,...,rn这个组合的条件概率,p(r1,r2,...,rn|hl)为在确认行业编码为hl的情况下,r1,r2,...,rn这个组合的条件概率,p(hl)为第l种经营范围的四级分类编码的概率,l∈[1,...,N];
计算argmax(p(hi|r1,r2,...,rn)),并作为最大概率的四级行业编码推荐数据选项,argmax(.)为求自变量最大的函数。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于江苏苏宁银行股份有限公司,未经江苏苏宁银行股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210973020.1/1.html,转载请声明来源钻瓜专利网。
- 上一篇:增湿器储存器
- 下一篇:一种基于纬编织平针组织金属骨架的复合管材及制备方法





