[发明专利]知识融合方法、装置、计算机设备和存储介质有效
申请号: | 201910884962.0 | 申请日: | 2019-09-19 |
公开(公告)号: | CN110807102B | 公开(公告)日: | 2023-09-29 |
发明(设计)人: | 凌岚;刘嘉伟;于修铭 | 申请(专利权)人: | 平安科技(深圳)有限公司 |
主分类号: | G06F16/36 | 分类号: | G06F16/36;G06F40/295 |
代理公司: | 北京市京大律师事务所 11321 | 代理人: | 谭争勇 |
地址: | 518033 广东省深圳市福田区福*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 知识 融合 方法 装置 计算机 设备 存储 介质 | ||
1.一种知识融合方法,其特征在于,包括:
获取待分析数据,根据所述待分析数据的数据结构,提取所述待分析数据中的实体数据;
将所述实体数据进行实体对齐,得到初步融合数据;
获取所述初步融合数据中的关系路径,根据所述关系路径,构建关系分类的特征向量;
根据所述特征向量,确定所述初步融合数据中未连接的实体数据之间的关系数据后,得到待检融合数据;
所述根据所述特征向量,确定所述初步融合数据中未连接的实体数据之间的关系数据后,得到待检融合数据,包括:
将所述特征向量中的元素进行词向量转换,得到关系矩阵;
计算所述关系矩阵的特征值,将特征值一致的关系矩阵对应的关系路径进行连接,得到数个所述初步融合数据中未连接的实体数据之间的可行关系路径;
应用打分函数对各所述可行关系路径进行打分,提取分数大于预设阈值的可行关系路径作为最终关系路径,汇总各所述最终关系路径得到所述待检融合数据;
对所述待检融合数据进行问题信息查询,去除所述问题信息后,得到最终融合数据。
2.根据权利要求1所述的知识融合方法,其特征在于,所述获取待分析数据,根据所述待分析数据的数据结构,提取所述待分析数据中的实体数据,包括:
获取所述待分析数据的数据来源标识,根据所述数据来源标识,确定所述待分析数据的数据结构;
若所述待分析数据为结构化表格,则根据所述实体数据在所述结构化表格中的位置,对所述待分析数据进行实体数据的提取;
若所述待分析数据为非结构化数据,则应用预设的实体词典,对所述待分析数据进行实体数据的提取。
3.根据权利要求2所述的知识融合方法,其特征在于,所述将所述实体数据进行实体对齐,得到初步融合数据,包括:
从所述实体数据中提取出两个或者两个以上具有相同名字的实体;
将所述两个或者两个以上具有相同名字的实体与预设的实体集合中的元素进行比较;
若所述两个或者两个以上具有相同名字的实体与预设的实体集合中的同一个元素相同,则所述两个或者两个以上具有相同名字的实体为同一实体;
将属于同一实体的实体数据进行实体合并后,得到所述初步融合数据。
4.根据权利要求1所述的知识融合方法,其特征在于,所述将所述实体数据进行实体对齐,得到初步融合数据,包括:
获取预设的实体区分模型,所述实体区分模型中包含实体向量和关系向量;
获取所述实体数据对应的关系数据,根据所述实体区分模型构建实体关系对集合,所述实体关系对集合中包括至少一个候选实体关系对,每个候选实体关系对包括给定实体关系和候选实体,所述候选实体与所述给定实体的类型相同;
应用打分函数对候选实体关系对中的实体向量和关系向量进行打分,抽取分数最高的候选实体关系对中的实体作为目标实体,将所述目标实体对应的数据进行融合后,得到所述初步融合数据。
5.根据权利要求1所述的知识融合方法,其特征在于,所述获取所述初步融合数据中的关系路径,根据所述关系路径,构建关系分类的特征向量,包括:
获取所述初步融合数据中的数条关系路径,提取各所述关系路径上的关系数据;
根据预设的关系规则,剔除不符合所述关系规则的所述关系路径;
以剩余关系路径上的关系数据为元素,构建数个所述特征向量。
6.根据权利要求1至5任一项所述的知识融合方法,其特征在于,所述对所述待检融合数据进行问题信息查询,去除所述问题信息后,得到最终融合数据,包括:
对所述待检融合数据进行分词,对分词后的所述待检融合数据进行字粒度检测,得到所述待检融合数据中各个字符的字粒度;
将所述字粒度与预设的字粒度阈值进行比较,若任一所述字粒度大于预设的字粒度阈值,则所述字粒度对应的字符位置为疑似错误位置;
遍历所有所述疑似错误位置,应用音似词典或形似词典替换所述疑似错误位置的字符;
应用语言模型对替换后的所述待检融合数据进行句子困惑度计算,根据计算结果,得到所述疑似错误位置的最终字符,所述最终字符对应的融合数据为所述最终融合数据。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于平安科技(深圳)有限公司,未经平安科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910884962.0/1.html,转载请声明来源钻瓜专利网。