[发明专利]异构数据库中的同义数据自动关联方法、装置及电子设备有效
申请号: | 201711377197.0 | 申请日: | 2017-12-19 |
公开(公告)号: | CN110019474B | 公开(公告)日: | 2022-03-04 |
发明(设计)人: | 郭杏荣 | 申请(专利权)人: | 北京金山云网络技术有限公司;北京金山云科技有限公司 |
主分类号: | G06F16/25 | 分类号: | G06F16/25;G06F16/2458;G06F40/247 |
代理公司: | 北京柏杉松知识产权代理事务所(普通合伙) 11413 | 代理人: | 马敬;项京 |
地址: | 100085 北京*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 数据库 中的 同义 数据 自动 关联 方法 装置 电子设备 | ||
本发明实施例提供了一种异构数据库中的同义数据自动关联方法、装置及电子设备,所述方法包括:获取第一数据库和第二数据库中的字段,其中,第一数据库与第二数据库互为异构数据库;基于预设字段与词库中词语的映射关系,查找获取的字段在词库中对应的词语,得到第一数据库中各字段各自对应的词语和第二数据库中各字段各自对应的词语,其中,词库包含第一数据库和第二数据库所属行业的专业术语;分别比较第一数据库中各字段各自对应的词语与第二数据库中各字段各自对应的词语的相似度,并将相似度高于预设阈值的第一数据库中的字段与第二数据库中的字段相关联。应用本发明实施例,能够提高异构数据库间同义数据关联的效率。
技术领域
本发明涉及数据处理技术领域,特别是涉及一种异构数据库中的同义数据自动关联方法、装置及电子设备。
背景技术
目前,完成相同或相近业务功能的软件系统往往存在多种实现方法,例如,面向个人消费者的各类网约车应用软件,面向企业的各类银行业务系统,以及各类医院信息化系统等。其中,这些业务功能相同或相近,但实现方式和内部结构不一致的软件系统被称为异构系统,异构系统中的各数据库被称为异构数据库。在异构数据库中,由于同样的数据在内部的命名、处理和存储等方面是存在差异的,因此将异构系统中完全等价表达同一业务对象或其属性的数据称为同义数据。
造成这一现象的主要原因是同一细分领域存在多家互相竞争的企业,例如我国为医院提供信息化系统的厂商,据不完全统计就有130多家,其中全国性的大型厂商就有10多家,且单一软件系统的市场占有率都不高,市场高度分散。最终导致行业内的数据形成了非常多的碎片,即“数据孤岛”,也导致不同厂商的软件系统,甚至同一厂商的软件系统的不同部署实例间,数据都无法打通和连接,这都为行业的融合、业务联动、丰富基于大数据的应用、以及政府和行业监管都带来了很大的阻碍和困难。要解决这些问题,首先在于打通数据,连接“数据孤岛”上的数据,这就需要将异构数据库中的同义数据进行关联。
现有的异构数据库中的同义数据关联方法是将同义数据统一转换为规范的格式来实现的。具体的,先由国家主管部门或行业组织制定一个数据标准规范,然后通过人工操作将这些异构数据库中的同义数据,按该数据标准规范转换为规范的数据格式,这样,转换后的同义数据的数据格式一致,从而实现异构数据库中的同义数据的关联。
但是,在现有的异构数据库中的同义数据关联的方法中,一方面,由于所制定的数据标准规范是非强制性的,其约束力不强,一些厂商往往并不遵守该数据标准规范或者部分遵守,这样,转换后的数据不符合所制定的数据标准规范;另一方面,数据按标准规范转换过程中,由于人工操作不可避免的会发生操作错误,也会使得转换后的数据不符合所制定的数据标准规范,最终导致异构数据库间同义数据关联的效率比较低。
发明内容
本发明实施例的目的在于提供一种异构数据库中的同义数据自动关联方法、装置及电子设备,以提高异构数据库间同义数据关联的效率。具体技术方案如下:
本发明实施例公开了一种异构数据库中的同义数据自动关联方法,所述方法包括:
获取第一数据库和第二数据库中的字段,其中,所述第一数据库与所述第二数据库互为异构数据库;
基于预设字段与词库中词语的映射关系,查找获取的所述字段在所述词库中对应的词语,得到所述第一数据库中各字段各自对应的词语和所述第二数据库中各字段各自对应的词语,其中,所述词库包含所述第一数据库和所述第二数据库所属行业的专业术语;
分别比较所述第一数据库中各字段各自对应的词语与所述第二数据库中各字段各自对应的词语的相似度,并将所述相似度高于预设阈值的第一数据库中的字段与第二数据库中的字段相关联。
可选的,所述映射关系包括如下映射关系中的一个或两个以上:
所述词库中词语的汉语拼音作为第一预设字段,与所述词库中词语的第一映射关系;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京金山云网络技术有限公司;北京金山云科技有限公司,未经北京金山云网络技术有限公司;北京金山云科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201711377197.0/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种太阳能产品试验数据分析系统
- 下一篇:数据持久化处理方法、装置及系统
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置