[发明专利]知识图谱构建及查询方法、装置、设备、存储介质及产品在审
| 申请号: | 202211658875.1 | 申请日: | 2022-12-22 |
| 公开(公告)号: | CN115827487A | 公开(公告)日: | 2023-03-21 |
| 发明(设计)人: | 邓豪;王冬冬;伍谦 | 申请(专利权)人: | 百度(中国)有限公司 |
| 主分类号: | G06F11/36 | 分类号: | G06F11/36;G06F16/36;G06F16/901 |
| 代理公司: | 北京英赛嘉华知识产权代理有限责任公司 11204 | 代理人: | 王达佐;马晓亚 |
| 地址: | 200041 上海市浦东新区张*** | 国省代码: | 上海;31 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 知识 图谱 构建 查询 方法 装置 设备 存储 介质 产品 | ||
1.一种知识图谱构建方法,包括:
获取源代码数据;
解析所述源代码数据,得到知识图谱以及所述知识图谱对应的场景信息和版本信息;
将所述源代码数据、所述知识图谱、所述场景信息和所述版本信息关联的保存至图谱数据库。
2.根据权利要求1所述的知识图谱构建方法,其中,所述知识图谱包括全量数据图谱和信息统计图谱,所述图谱数据库包括文件数据库和关系数据库;以及
所述解析所述源代码数据,得到知识图谱,包括:
解析所述源代码数据,得到所述全量数据图谱和所述全量数据图谱中各类信息的统计数据;
根据所述各类信息的统计数据,构建所述信息统计图谱;
所述将所述源代码数据、所述知识图谱、所述场景信息和所述版本信息关联的保存至图谱数据库,包括:
将所述源代码数据、所述全量数据图谱、所述场景信息和所述版本信息关联的保存至所述文件数据库,将所述信息统计图谱、所述场景信息和所述版本信息关联的保存至所述关系数据库。
3.根据权利要求2所述的知识图谱构建方法,其中,所述解析所述源代码数据,得到所述全量数据图谱,包括:
解析所述源代码数据,得到所述源代码数据的语法树结构;
根据所述语法树结构,构建所述全量数据图谱。
4.根据权利要求1所述的知识图谱构建方法,其中,所述源代码数据包括至少两个代码块,所述知识图谱包括代码块间的信息关系图谱,所述图谱数据库包括图数据库;以及
所述解析所述源代码数据,得到知识图谱,包括:
提取所述至少两个代码块之间的交互代码数据;
解析所述交互代码数据,得到所述代码块间的信息关系图谱;
所述将所述源代码数据、所述知识图谱、所述场景信息和所述版本信息关联的保存至图谱数据库,包括:
将所述源代码数据、所述信息关系图谱、所述场景信息和所述版本信息关联的保存至所述图数据库。
5.根据权利要求1所述的知识图谱构建方法,其中,所述解析所述源代码数据,得到知识图谱,包括:
提取所述源代码数据相对于前一版本源代码数据的不变数据和变更数据;
从所述前一版本源代码数据的历史知识图谱中获取所述不变数据对应的历史图谱信息;
解析所述变更数据,得到所述变更数据的更新图谱信息;
根据所述不变图谱信息和所述更新图谱信息,构建所述知识图谱。
6.根据权利要求5所述的知识图谱构建方法,其中,所述解析所述变更数据,得到所述变更数据的更新图谱信息,包括:
提取所述变更数据中的模糊数据;
根据所述源代码数据,回填所述模糊数据,得到补正数据;
根据所述补正数据,更新所述变更数据;
解析更新后的变更数据,得到所述变更数据的更新图谱信息。
7.根据权利要求1-6中任一项所述的知识图谱构建方法,其中,所述将所述源代码数据、所述知识图谱、所述场景信息和所述版本信息关联的保存至图谱数据库,包括:
根据所述场景信息,确定所述知识图谱的目标存储位置和目标存储周期;
按照所述目标存储周期,在所述图谱数据库中的所述目标存储位置保存所述源代码数据、所述知识图谱、所述场景信息和所述版本信息。
8.一种知识图谱查询方法,包括:
接收查询请求,所述查询请求包括目标版本信息和/或目标场景信息;
根据所述目标版本信息和/或目标场景信息,从图谱数据库中查询目标知识图谱,所述目标知识图谱为根据权利要求1-7中任一项所述方法构建的知识图谱。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于百度(中国)有限公司,未经百度(中国)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202211658875.1/1.html,转载请声明来源钻瓜专利网。





