[发明专利]一种基于多源数据库的科技资源集成系统在审
| 申请号: | 202110580535.0 | 申请日: | 2021-05-26 |
| 公开(公告)号: | CN113312342A | 公开(公告)日: | 2021-08-27 |
| 发明(设计)人: | 张辉;涂昱;金盛豪;葛胤池;王德庆 | 申请(专利权)人: | 北京航空航天大学 |
| 主分类号: | G06F16/215 | 分类号: | G06F16/215;G06F16/25;G06F16/24 |
| 代理公司: | 北京汲智翼成知识产权代理事务所(普通合伙) 11381 | 代理人: | 陈曦;贾兴昌 |
| 地址: | 100191*** | 国省代码: | 北京;11 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 基于 数据库 科技 资源 集成 系统 | ||
1.一种基于多源数据库的科技资源集成系统,包括采集层、处理层、呈现层以及多源数据库,其特征在于:
所述采集层包括元数据采集模块和元数据清洗模块,用于接收多个数据源的科技资源元数据,将多源异构科技资源元数据存储为统一的存储格式并对数据进行清洗;
所述处理层包括中间模式模块、模式匹配模块、模式映射模块以及数据融合模块,用于将异构异质的科技资源元数据映射到统一的语义结构中;
所述呈现层包括数据查询引擎和标准化输出模块,用于将科技资源元数据输出为特定的标准形式;
所述多源数据库包括存储科技资源元数据的多种数据库,分别与所述采集层、所述处理层及所述呈现层连接,用于将来源不同的科技资源进行集中存储。
2.如权利要求1所述的科技资源集成系统,其特征在于:
所述科技资源元数据只经过数据采集步骤和数据清洗步骤,直接存入所述多源数据库中;其中,存入所述多源数据库的格式与原格式保持不变。
3.如权利要求1所述的科技资源集成系统,其特征在于:
在所述采集层中,多个异构异质科技资源元数据经过元数据采集模块处理后直接存入多源数据库中;元数据清洗模块从多源数据库中读取所有的新加入的科技资源元数据并进行清洗,完成对数据自身缺失值、无效值以及冗余值的处理;最终清洗完毕的元数据重新存入多源数据库,以便向处理层汇聚。
4.如权利要求3所述的科技资源集成系统,其特征在于:
所述元数据采集模块采用动态采集方式获取数据;所述动态采集方式包括:根据科技资源元数据服务机构给出的数据接口获取相应的数据信息,通过与元数据服务机构共享资源池获取数据,利用爬虫技术在该机构的网页下爬取数据。
5.如权利要求1所述的科技资源集成系统,其特征在于:
在所述处理层中,经采集层处理的科技资源元数据作为所述处理层的输入,首先由中间模式模块生成科技资源的统一视图,然后属性匹配模块根据属性间相似度生成科技资源的源模式与中间模式的模式映射关系,接着模式映射模块根据语义关系生成源模式中数据与中间模式中数据的映射方法,再经数据融合模块处理以解决科技资源冲突值问题,最后将得到的属性关系图存入图数据库中。
6.如权利要求5所述的科技资源集成系统,其特征在于所述源模式和中间模式之间的模式映射关系包括三种类型:
1)全局视图:说明如何通过查询科技资源源模式来获取中间模式的数据;
2)局部视图:将源模式中的数据视为中间模式的一个视图;
3)全局局部视图:将中间模式和源模式都视为一个虚拟模式的视图。
7.如权利要求5所述的科技资源集成系统,其特征在于所述数据融合模块采用三种处理方式中的任意一种或多种解决科技资源冲突值问题:
1)真值发现:在冲突值中寻找为真的值,通过对数据源进行评分的方式在科技资源数据源之间达成一致;
2)可信度评估:对每个科技资源数据源,根据其提供数据的正确程度来评价它的可信度,可信度越高的科技资源数据源中的数据有更高的分值;
3)复制检测:在不同的科技资源数据源间进行复制检测,计算分值时,被复制的数据源分值应高于复制的数据源分值。
8.如权利要求1所述的科技资源集成系统,其特征在于:
所述呈现层包括数据查询引擎;所述数据查询引擎提供查询多源数据库中科技资源元数据的接口,将输入的科技资源元数据标准与多源数据库中的科技资源元数据进行映射,把不同的语义成分映射到规范的元数据域中,从而确定需要导出的内容范围以及字段。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京航空航天大学,未经北京航空航天大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110580535.0/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种地下水钻探监测系统
- 下一篇:车道保持控制方法、控制装置和车辆





