[发明专利]确定企业属性相似性、重名对象判定在审
| 申请号: | 202011336327.8 | 申请日: | 2020-11-25 |
| 公开(公告)号: | CN112417879A | 公开(公告)日: | 2021-02-26 |
| 发明(设计)人: | 苏国辉 | 申请(专利权)人: | 上海水滴征信服务有限公司 |
| 主分类号: | G06F40/295 | 分类号: | G06F40/295;G06K9/62;G06F16/35;G06F16/36;G06N3/04;G06N3/08 |
| 代理公司: | 中国专利代理(香港)有限公司 72001 | 代理人: | 施能佳;姜冰 |
| 地址: | 201206 上海市浦东新区*** | 国省代码: | 上海;31 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 确定 企业 属性 相似性 重名 对象 判定 | ||
1.一种确定企业属性相似性的方法,包括:
根据两个企业的名称确定名称相似性;
根据两个企业的地址确定地址相似性;
根据两个企业的注册资金确定注册资金相似性;
根据两个企业关联的人名确定人名相似性;以及
利用分类器根据所述名称相似性、所述地址相似性、所述注册资金相似性、所述人名相似性来确定企业属性相似性。
2.根据权利要求1所述的方法,根据所述名称中相同字符的数量、所述相同字符在较短名称中的位置以及所述名称的长度确定所述名称相似性。
3.根据权利要求2所述的方法,通过下式计算所述名称相似性:
其中,simname表示所述名称相似性,k表示所述相同字符的数量,i表示所述相同字符在较短名称中的位置编码,length1和length2表示企业名称的长度。
4.根据权利要求1所述的方法,根据所述地址中的行政区划层级的归属确定所述地址相似性。
5.根据权利要求4所述的方法,通过下式计算所述地址相似性:
其中,simaddress表示所述地址相似性,A、B和C为大于0的系数;以及
若所述地址同省则x为1,否则为0;若所述地址同市则y为1,否则为0;若所述地址同区则z为1,否则为0。
6.根据权利要求5所述的方法,其中A<B且B<C。
7.根据权利要求1所述的方法,通过下式计算所述注册资金相似性:
其中,simregistered_capital表示所述注册资金相似性,r1、r2分别表示两个企业的所述注册资金;以及
若所述注册资金单位相同则m为1,否则为-1。
8.根据权利要求1所述的方法,根据所述关联的人名中重名对象的数量,以及与所述重名对象所关联的全部企业数量确定所述人名相似性。
9.根据权利要求8所述的方法,通过下式计算所述人名相似性:
其中,simpname表示所述人名相似性,n表示所述重名对象的数量,numi表示第i个重名对象所关联的全部企业数量。
10.根据权利要求1所述的方法,若两个企业中任意一者缺少名称、地址、注册资金、关联的人名的信息,则对应的名称相似性、地址相似性、注册资金相似性、人名相似性置为预定值。
11.根据权利要求1所述的方法,所述分类器为梯度提升树或者神经网络。
12.根据权利要求1所述的方法,所述企业属性相似性为概率值,若所述企业属性相似性大于预定值则判定两个企业相似,反之不相似。
13.一种训练分类器的方法,该方法基于已知其企业属性相似性的两个企业,包括:
根据两个企业的名称确定名称相似性;
根据两个企业的地址确定地址相似性;
根据两个企业的注册资金确定注册资金相似性;
根据两个企业关联的人名确定人名相似性;以及
以所述名称相似性、所述地址相似性、所述注册资金相似性、所述人名相似性为输入,以所述企业属性相似性为输出训练所述分类器。
14.一种判断两个企业的重名对象是否相同的方法,包括:
根据权利要求1-12中任一项所述的方法确定企业属性相似性;以及
若判断两个企业相似则重名对象相同,否则不同。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海水滴征信服务有限公司,未经上海水滴征信服务有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011336327.8/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种产品内管贴标装箱一体式设备
- 下一篇:一种建筑用可调式多功能墙壁钻孔装置





