[发明专利]异构数据库中的同义数据自动关联方法、装置及电子设备有效
申请号: | 201711377197.0 | 申请日: | 2017-12-19 |
公开(公告)号: | CN110019474B | 公开(公告)日: | 2022-03-04 |
发明(设计)人: | 郭杏荣 | 申请(专利权)人: | 北京金山云网络技术有限公司;北京金山云科技有限公司 |
主分类号: | G06F16/25 | 分类号: | G06F16/25;G06F16/2458;G06F40/247 |
代理公司: | 北京柏杉松知识产权代理事务所(普通合伙) 11413 | 代理人: | 马敬;项京 |
地址: | 100085 北京*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 数据库 中的 同义 数据 自动 关联 方法 装置 电子设备 | ||
1.一种异构数据库中的同义数据自动关联方法,其特征在于,所述方法包括:
获取第一数据库和第二数据库中的字段,其中,所述第一数据库与所述第二数据库互为异构数据库;
基于预设字段与词库中词语的映射关系,查找获取的所述字段在所述词库中对应的词语,得到所述第一数据库中各字段各自对应的词语和所述第二数据库中各字段各自对应的词语,其中,所述词库包含所述第一数据库和所述第二数据库所属行业的专业术语;所述预设字段与词库中词语的映射关系为预设字段到预设字段在词库中对应的词语的对应关系;
分别比较所述第一数据库中各字段各自对应的词语与所述第二数据库中各字段各自对应的词语的相似度,并将所述相似度高于预设阈值的第一数据库中的字段与第二数据库中的字段相关联;
所述映射关系包括如下映射关系中的一个或两个以上:
所述词库中词语的汉语拼音作为第一预设字段,与所述词库中词语的第一映射关系;
所述词库中词语的汉语拼音的首字母作为第二预设字段,与所述词库中词语的第二映射关系;
所述词库中词语的英文单词作为第三预设字段,与所述词库中词语的第三映射关系;
所述词库中词语的英文单词的缩写作为第四预设字段,与所述词库中词语的第四映射关系;
基于预设字段与词库中词语的映射关系,查找获取的所述字段在所述词库中对应的词语,得到所述第一数据库中各字段各自对应的词语和所述第二数据库中各字段各自对应的词语,包括:
基于所述第一映射关系、所述第二映射关系、所述第三映射关系和所述第四映射关系中的一个或两个以上映射关系,查找获取的所述字段在所述词库中对应的词语,得到所述第一数据库中各字段各自对应的词语和所述第二数据库中各字段各自对应的词语。
2.根据权利要求1所述的方法,其特征在于,所述基于所述第一映射关系、所述第二映射关系、所述第三映射关系和所述第四映射关系中的一个或两个以上映射关系,查找获取的所述字段在所述词库中对应的词语,得到所述第一数据库中各字段各自对应的词语和所述第二数据库中各字段各自对应的词语,包括:
确定获取的所述字段的预设字段类别,所述预设字段类别为所述第一预设字段、所述第二预设字段、所述第三预设字段和所述第四预设字段中的一种;
在确定的所述字段的预设字段类别对应的映射关系中,查找所述字段在所述词库中对应的词语,得到所述第一数据库中各字段对应的各词语和所述第二数据库中各字段对应的各词语。
3.根据权利要求2所述的方法,其特征在于,所述确定获取的所述字段的预设字段类别,包括:
当获取的所述字段包含多种预设字段时,将所述字段分段,确定分段后每个字段的预设字段类别分别为所述第一预设字段、所述第二预设字段、所述第三预设字段和所述第四预设字段中的一种;
在确定的所述字段的预设字段类别对应的映射关系中,查找所述字段在所述词库中对应的词语,得到所述第一数据库中各字段对应的各词语和所述第二数据库中各字段对应的各词语,包括:
在确定的所述字段的预设字段类别对应的映射关系中,分别查找分段后每个字段在所述词库中对应的词语,并将所述各词语组合,得到所述第一数据库中各字段对应的各词语和所述第二数据库中各字段对应的各词语。
4.根据权利要求3所述的方法,其特征在于,所述在确定的所述字段的预设字段类别对应的映射关系中,分别查找分段后每个字段在所述词库中对应的词语,并将所述各词语组合,得到所述第一数据库中各字段对应的各词语和所述第二数据库中各字段对应的各词语,包括:
在确定的所述字段的预设字段类别对应的映射关系中,查找分段后的每一个字段在所述词库中对应的词语;
按照分段后各字段从左到右的顺序,将前两个字段在所述词库中对应的词语进行组合,并将组合得到的词语作为各字段对应的首个词语;
依次将所述首个词语与未组合的下一个相邻字段在所述词库中对应的词语进行组合,并将组合得到的词语替换所述首个词语,直至所有的字段在所述词库中对应的词语都被组合,得到所述字段对应的词语。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京金山云网络技术有限公司;北京金山云科技有限公司,未经北京金山云网络技术有限公司;北京金山云科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201711377197.0/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种太阳能产品试验数据分析系统
- 下一篇:数据持久化处理方法、装置及系统
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置