[发明专利]一种基于字段语义的数据表自动join推荐方法在审
申请号: | 202110924937.8 | 申请日: | 2021-08-12 |
公开(公告)号: | CN113673252A | 公开(公告)日: | 2021-11-19 |
发明(设计)人: | 罗实;李炜铭;王永恒 | 申请(专利权)人: | 之江实验室 |
主分类号: | G06F40/30 | 分类号: | G06F40/30;G06F40/289;G06K9/62;G06N3/04;G06N3/08 |
代理公司: | 杭州浙科专利事务所(普通合伙) 33213 | 代理人: | 孙孟辉 |
地址: | 310023 浙江省杭州市余*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明涉及多维数据分析领域,具体为一种基于字段语义的数据表自动join推荐方法,包括:步骤1,将待join的两数据表中的字段两两组合,作为计算相似度值的集合;步骤2,推断出字段的语义类型;步骤3,判断两字段的数据类型和语义类型是否一致,再判断两字段名是否一致,接着判断两字段值是否存在枚举类;步骤4,分别计算字段名相似度和字段值的相似度,后通过加权求和,得到匹配系数,即两字段的相似度;步骤5,将所有字段的相似度的分值从高到低进行排序并输出提取前20条,作为推荐。本发明通过对数据表字段名和字段值的分析来推荐join的联接子句,更准确更全面地帮助用户发现多维数据隐藏的关联信息,有效地提升大数据分析系统的智能化水平。 | ||
搜索关键词: | 一种 基于 字段 语义 数据表 自动 join 推荐 方法 | ||
【主权项】:
暂无信息
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于之江实验室,未经之江实验室许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/202110924937.8/,转载请声明来源钻瓜专利网。
- 上一篇:一种给袋式自动包装机
- 下一篇:图像噪声预估方法、装置、电子设备和存储介质