[发明专利]代码匹配方法、装置及存储介质有效

申请号：	201811403873.1	申请日：	2018-11-23
公开（公告）号：	CN109325105B	公开（公告）日：	2021-06-29
发明（设计）人：	郝晓波	申请（专利权）人：	泰康保险集团股份有限公司;泰康养老保险股份有限公司
主分类号：	G06F16/33	分类号：	G06F16/33;G06F16/335
代理公司：	北京同立钧成知识产权代理有限公司 11205	代理人：	朱颖;刘芳
地址：	100031 北京市西***	国省代码：	北京;11
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	代码匹配方法装置存储介质
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【说明书】：

本发明提供一种代码匹配方法、装置及存储介质，该方法包括：获取待匹配的源代码表和目标代码表，其中，源代码表包括至少一组第一代码与第一文本的对应关系，目标代码表包括至少一组第二代码与第二文本的对应关系，接着，根据逐个载取词法对第一文本以及第二文本进行分词处理，获取分词结果，进一步，根据分词结果，获取第一文本与每个第二文本的匹配度，再根据匹配度以及预设完全采信阈值，生成代码对照表。本发明通过对源代码表和目标代码表进行最小粒度的分词处理，使得分词结果细化程度越高，有利于提高匹配的准确度，之后根据分词结果将第一文本与第二文本进行交叉对比，通过简单的算法即可实现，在保证了准确度的基础上，有效提高匹配效率。

技术领域

本发明涉及领域计算机技术领域，尤其涉及一种代码匹配方法、装置及存储介质。

背景技术

针对姓名、国家、城市、疾病、地址等通用信息，在不同的应用系统中常常采用不同的编码规则体系，在不同的多个应用系统对接的开发中，由于所使用的编码规则体系不同，常常需要将不同系统的代码表进行相互匹配。

现有技术中通常采用人工匹配的方式进行转换，但是，由于数据量庞大，人工匹配的方式效率极低。

发明内容

本发明提供一种代码匹配方法、装置及存储介质，以实现不同应用系统之间代码表的自动匹配，提高匹配效率。

第一方面，本发明提供一种代码匹配方法，包括：

获取待匹配的源代码表和目标代码表，其中，所述源代码表包括至少一组第一代码与第一文本的对应关系，所述目标代码表包括至少一组第二代码与第二文本的对应关系；

根据逐个载取词法对所述第一文本以及所述第二文本进行分词处理，获取分词结果；

根据所述分词结果，获取所述第一文本与每个所述第二文本的匹配度；

根据所述匹配度以及预设完全采信阈值，生成代码对照表。