[发明专利]一种多源异构数据融合系统在审
申请号: | 201811032670.6 | 申请日: | 2018-09-05 |
公开(公告)号: | CN109308311A | 公开(公告)日: | 2019-02-05 |
发明(设计)人: | 谢妮珍 | 申请(专利权)人: | 广州小楠科技有限公司 |
主分类号: | G06F16/25 | 分类号: | G06F16/25 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 510000 广东省广州市天河区五山*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明提供了一种多源异构数据融合系统,包括数据获取模块、数据预处理模块、匹配模块、融合模块和评价模块,所述数据获取模块用于从不同网站获取商品的多源异构数据,所述数据预处理模块用于对数据进行规范化处理,生成短文本,所述规范化处理包括分词和去除停用词,所述匹配模块用于对短文本进行匹配,所述融合模块基于文本匹配结果对数据进行融合,所述评价模块用于对数据融合效果进行评价。本发明的有益效果为:提供了一种多源异构数据融合系统,通过对数据进行预处理和文本匹配,实现了多源异构数据的融合,有助于建立完整性、准确性和一致性强的知识库。 | ||
搜索关键词: | 多源异构数据 融合系统 数据预处理模块 数据获取模块 匹配模块 评价模块 融合模块 文本匹配 短文本 预处理 知识库 数据融合 规范化 融合 停用词 分词 去除 网站 匹配 | ||
【主权项】:
1.一种多源异构数据融合系统,其特征在于,包括数据获取模块、数据预处理模块、匹配模块、融合模块和评价模块,所述数据获取模块用于从不同网站获取商品的多源异构数据,所述数据预处理模块用于对数据进行规范化处理,生成短文本,所述规范化处理包括分词和去除停用词,所述匹配模块用于对短文本进行匹配,所述融合模块基于文本匹配结果对数据进行融合,所述评价模块用于对数据融合效果进行评价。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于广州小楠科技有限公司,未经广州小楠科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201811032670.6/,转载请声明来源钻瓜专利网。