[发明专利]数据处理方法和装置、电子设备、计算机可读介质有效
| 申请号: | 202110319599.5 | 申请日: | 2021-03-25 |
| 公开(公告)号: | CN112989066B | 公开(公告)日: | 2023-06-23 |
| 发明(设计)人: | 孟倩茹;何赛松;郝伟;杨丽秦 | 申请(专利权)人: | 北京百度网讯科技有限公司 |
| 主分类号: | G06F16/36 | 分类号: | G06F16/36;G06F16/33 |
| 代理公司: | 北京英赛嘉华知识产权代理有限责任公司 11204 | 代理人: | 王达佐;马晓亚 |
| 地址: | 100085 北京市*** | 国省代码: | 北京;11 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 数据处理 方法 装置 电子设备 计算机 可读 介质 | ||
1.一种数据处理方法,所述方法包括:
获取网络产品的接口文本数据;
基于所述接口文本数据,提取所述网络产品的至少一个资源和各个资源对应的至少一个接口;所述基于所述接口文本数据,提取所述网络产品的至少一个资源和各个资源对应的至少一个接口,包括:
基于所述接口文本数据,提取所述网络产品的至少一个资源和各个资源对应的操作;确定各个操作的类型;基于所述接口文本数据,确定各个操作类型对应的至少一个接口;所述基于所述接口文本数据,提取所述网络产品的至少一个资源和各个资源对应的操作,包括:
采用词法分析模型对所述接口文本数据进行词性标注;基于所述词法分析模型输出的所述接口文本数据中不同词的属性,区分所述网络产品的资源和各个资源对应的操作;
基于所述接口文本数据和所述至少一个接口,确定所述至少一个资源中各个资源之间的依赖关系;
基于至少一个资源、各个资源对应的至少一个接口和各个资源之间的依赖关系,构建所述网络产品的知识图谱;
采用所述知识图谱进行数据处理,得到数据处理结果,包括:获取网络产品的初始资源以及与所述初始资源对应的业务资源;基于所述知识图谱,提取与所述初始资源具有依赖关系的依赖资源;响应于所述业务资源属于所述依赖资源中的一种或多种资源,确定所述业务资源与所述初始资源具有依赖关系。
2.根据权利要求1所述的方法,所述方法还包括:
基于所述接口文本数据,确定所述至少一个接口中各个接口之间的依赖关系;
将所述各个接口之间的依赖关系融合至所述知识图谱中。
3.根据权利要求1所述的方法,所述采用所述知识图谱进行数据处理,得到数据处理结果包括:
接收网络产品的原始数据;
基于所述知识图谱,查询与所述原始数据对应的接口;
基于所述接口,得到所述原始数据的清洗后的数据。
4.根据权利要求1所述的方法,在确定所述业务资源与所述初始资源具有依赖关系之前,所述方法还包括:
基于所述知识图谱,提取与所述初始资源对应的第一接口;
基于所述知识图谱,提取与所述业务资源对应的第二接口;
响应于所述第一接口与所述第二接口具有交集接口,确定所述业务资源与所述初始资源具有依赖关系。
5.一种数据处理装置,所述装置包括:
获取单元,被配置成获取网络产品的接口文本数据;
提取单元,被配置成基于所述接口文本数据,提取所述网络产品的至少一个资源和各个资源对应的至少一个接口;
资源确定单元,被配置成基于所述接口文本数据和所述至少一个接口,确定所述至少一个资源中各个资源之间的依赖关系;所述资源确定单元包括:提取模块,被配置成基于所述接口文本数据,提取所述网络产品的至少一个资源和各个资源对应的操作;类型确定模块,被配置成确定各个操作的类型;接口确定模块,被配置成基于所述接口文本数据,确定各个操作类型对应的至少一个接口;所述提取模块包括:标注子模块,被配置成采用词法分析模型对所述接口文本数据进行词性标注;区分子模块,被配置成基于所述词法分析模型输出的所述接口文本数据中不同词的属性,区分所述网络产品的资源和各个资源对应的操作;
构建单元,被配置成基于至少一个资源、各个资源对应的至少一个接口和各个资源之间的依赖关系,构建所述网络产品的知识图谱;
处理单元,被配置成采用所述知识图谱进行数据处理,得到数据处理结果;所述处理单元包括:获取模块,被配置成获取网络产品的初始资源以及与所述初始资源对应的业务资源;资源提取模块,被配置成基于所述知识图谱,提取与所述初始资源具有依赖关系的依赖资源;资源确定模块,被配置成响应于所述业务资源属于所述依赖资源中的一种或多种资源,确定所述业务资源与所述初始资源具有依赖关系。
6.根据权利要求5所述的装置,所述装置还包括:
接口确定单元,被配置成基于所述接口文本数据,确定所述至少一个接口中各个接口之间的依赖关系;
融合单元,被配置成将所述各个接口之间的依赖关系融合至所述知识图谱中。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京百度网讯科技有限公司,未经北京百度网讯科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110319599.5/1.html,转载请声明来源钻瓜专利网。





