[发明专利]证件验真方法和装置、服务器、存储介质有效
申请号: | 201711498581.6 | 申请日: | 2017-12-29 |
公开(公告)号: | CN108053545B | 公开(公告)日: | 2020-05-15 |
发明(设计)人: | 王刘强 | 申请(专利权)人: | 百度在线网络技术(北京)有限公司 |
主分类号: | G07D7/206 | 分类号: | G07D7/206;G06F16/903;G06F40/289 |
代理公司: | 北京品源专利代理有限公司 11332 | 代理人: | 孟金喆 |
地址: | 100085 北京市*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 证件 方法 装置 服务器 存储 介质 | ||
1.一种证件验真方法,其特征在于,包括:
从证件的图像中识别出第一信息源,其中,第一信息源包括所述证件的至少一种参数;
根据所述证件的图像和预设途径获取第二信息源,其中,第二信息源包括所述证件的至少一种参数;
将第一信息源和第二信息源中相同类型的参数进行比较,计算得到所述相同类型的参数对应的可信度值;
依据所述相同类型的参数对应的可信度值计算所述证件的整体可信度值,依据所述整体可信度值确定所述证件的真伪;
其中,如果所述相同类型的参数为营业执照的名称,则计算所述名称对应的可信度值,包括:
对第一信息源和第二信息源中的名称分别进行分词,得到第一名称分词结果和第二名称分词结果;
根据预设通用词库,去除第一名称分词结果和第二名称分词结果中的通用词,得到第一主题字符串和第二主题字符串;
获取第一主题字符串和第二主题字符串的最长公共子串;
确定第一主题字符串和第二主题字符串相比字符串长度小的主题字符串长度为目标名称长度,计算所述最长公共子串的长度与目标名称长度的比值,将所述比值作为所述名称对应的可信度值。
2.根据权利要求1所述的方法,其特征在于,所述证件包括营业执照;相应地,
所述营业执照的至少一种参数包括名称、地址、法人和编号中的至少一种;
第一信息源是利用光学字符识别技术从所述营业执照的图像中识别出来;
第二信息源是利用所述营业执照中的二维码获取到。
3.根据权利要求2所述的方法,其特征在于,所述方法还包括:
如果利用所述二维码无法获取第二信息源,则利用所述营业执照上的统一信用号和政府网站查询获取第三信息源;
相应地,所述将第一信息源和第二信息源中相同类型的参数进行比较,计算得到所述相同类型的参数对应的可信度值,包括:
将第一信息源和第三信息源中相同类型的参数进行可信度计算,得到所述相同类型的参数对应的可信度值。
4.根据权利要求3所述的方法,其特征在于,所述方法还包括:
如果利用所述光学字符识别技术无法识别出第一信息源,则确定验真失败;
如果无法识别出第二信息源和第三信息源,则确定验真失败。
5.根据权利要求2所述的方法,其特征在于,所述方法还包括:
如果所述二维码对应的内容是网址,则判断所述网址与所述营业执照所属的省的预设网址是否匹配,若不匹配,则确定所述营业执照为伪造,若匹配,则通过所述网址获取第二信息源;
如果所述二维码对应的内容是营业执照数据,则判断所述营业执照数据与所述营业执照所属的省的预设数据模板是否匹配,若不匹配,则确定所述营业执照为伪造,若匹配,则将所述营业执照数据作为第二信息源。
6.根据权利要求2所述的方法,其特征在于,如果所述相同类型的参数为所述地址,所述方法还包括:
通过分词获取第一信息源和第二信息源的地址中各自的省市区数据;
如果第一信息源的省市区数据与第二信息源的省市区数据不匹配,则确定所述营业执照为伪造。
7.根据权利要求6所述的方法,其特征在于,计算所述地址对应的可信度值包括:
获取第一信息源和第二信息源的地址中,除所述省市区数据之外的最长公共子串;
确定第一信息源的地址和第二信息源的地址相比字符串长度小的地址长度为目标地址长度,计算所述最长公共子串的长度与目标地址长度的比值,将所述比值作为所述地址对应的可信度值。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于百度在线网络技术(北京)有限公司,未经百度在线网络技术(北京)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201711498581.6/1.html,转载请声明来源钻瓜专利网。