[发明专利]校验处理的方法、装置、电子设备和存储介质有效
申请号: | 201810045917.1 | 申请日: | 2018-01-17 |
公开(公告)号: | CN108256074B | 公开(公告)日: | 2020-06-23 |
发明(设计)人: | 崔金辉 | 申请(专利权)人: | 贝壳找房(北京)科技有限公司 |
主分类号: | G06F16/25 | 分类号: | G06F16/25 |
代理公司: | 北京路浩知识产权代理有限公司 11002 | 代理人: | 王莹;李相雨 |
地址: | 100085 北京市海淀区*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 校验 处理 方法 装置 电子设备 存储 介质 | ||
1.一种校验处理的方法,其特征在于,所述方法包括:
获取待校验的数据仓库的模型,每一模型包括多个字段信息,所述字段信息包括字段定义和字段类型;
根据预先存储的数据字典,对所述字段信息进行校验,所述数据字典包括多个标准用语,每一标准用语包括标准定义和标准类型;
若所述字段定义与标准定义匹配且所述字段类型与标准类型不匹配,则将所述字段类型修改为与标准类型一致;
若字段定义与标准定义匹配且字段类型与标准类型不匹配,则将字段类型修改为与标准类型一致的步骤之后,所述方法包括:
如果字段定义与标准定义不匹配,则对每一字段信息进行数据预处理,得到多个词素;
获取预先存储的规则管理库,所述规则管理库包括多个替换规则,每一替换规则包括修饰词和分类词;
如果词素与修饰词匹配,则判断是否存在所述词素的分类词;
如果不存在,则将所述词素替换为所述词素和对应的分类词。
2.根据权利要求1所述的方法,其特征在于:所述字段定义包括字段名和字段描述,所述标准定义包括标准名和标准描述,相应地,根据预先存储的数据字典,对字段信息进行校验的步骤具体为:
若所述字段名与标准名匹配,则校验所述字段描述是否与标准描述一致,并校验字段类型是否与标准类型一致;
或者;
若所述字段描述与标准描述匹配,则校验所述字段名是否与标准名一致,并校验字段类型是否与标准类型一致。
3.根据权利要求1所述的方法,其特征在于:如果字段定义与标准定义不匹配,则对每一字段信息进行数据预处理,得到多个词素的步骤具体为:
对每一字段信息进行解析,生成对应的json字符串;
针对每一json字符串,进行分词处理,得到多个词素。
4.根据权利要求1所述的方法,其特征在于:所述词素包括中文词素和/或英文词素,相应地,若词素与修饰词匹配,则判断是否存在所述词素的分类词的步骤之后,所述方法包括:
如果词素与修饰词不匹配,则获取预先存储的业务字典,所述业务字典包括多个业务用语,每一业务用语包括中文用语和英文用语;
如果中文词素与中文用语匹配且所述词素中不存在对应的英文用语,则备注所述中文词素,以供增加所述中文词素的英文用语;
如果英文词素与英文用语匹配且所述词素中不存在英文用语对应的中文用语,则备注所述英文词素,以供增加所述英文词素的中文用语。
5.根据权利要求3所述的方法,其特征在于:所述词素包括中文词素和/或英文词素,相应地,将所述词素替换为所述词素和对应的分类词的步骤之后,所述方法包括:
获取预先存储的业务字典,所述业务字典包括多个业务用语,每一业务用语包括中文用语和英文用语;
如果中文词素与中文用语匹配且所述词素中不存在对应的英文用语,则备注所述中文词素,以供增加所述中文词素的英文用语;
如果英文词素与英文用语匹配且所述词素中不存在英文用语对应的中文用语,则备注所述英文词素,以供增加所述英文词素的中文用语。
6.根据权利要求1所述的方法,其特征在于:若字段定义与标准定义匹配且字段类型与标准类型不匹配,则将字段类型修改为与标准类型一致的步骤之后,所述方法包括:
如果字段定义与标准定义不匹配,则对所述字段定义进行训练;
若满足预设的条件,则将所述字段定义作为标准定义。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于贝壳找房(北京)科技有限公司,未经贝壳找房(北京)科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810045917.1/1.html,转载请声明来源钻瓜专利网。