首页在售求购查询申请展会资讯专利榜企服商城升级VIP

立即登录免费注册

在售专利
求购专利
查询专利
新闻资讯
技术展会
招商加盟
专利榜

本网专利代理业务由天津创信方达专利代理事务所(普通合伙)承接机构代码：12247 本网专利代理业务由天津创信方达专利代理事务所(普通合伙)承接机构代码：12247 本网专利代理业务由天津创信方达专利代理事务所(普通合伙)承接机构代码：12247

本网专利代理业务由天津创信方达专利代理事务所(普通合伙)承接机构代码：12247 本网专利代理业务由天津创信方达专利代理事务所(普通合伙)承接机构代码：12247 本网专利代理业务由天津创信方达专利代理事务所(普通合伙)承接机构代码：12247

[发明专利]面向知识图谱构建的细粒度中文属性对齐方法有效

申请号：	201710077245.8	申请日：	2017-02-14
公开（公告）号：	CN106897403B	公开（公告）日：	2019-03-26
发明（设计）人：	付琨;许光銮;梁霄;孙显;李峰;孙鸿志;王楠	申请（专利权）人：	中国科学院电子学研究所
主分类号：	G06F16/25	分类号：	G06F16/25
代理公司：	北京安博达知识产权代理有限公司 11271	代理人：	徐国文
地址：	100190 ***	国省代码：	北京;11
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	面向知识图谱构建细粒度中文属性对齐方法
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【权利要求书】：

1.一种面向知识图谱构建的细粒度中文属性对齐方法，其特征在于，包括：

步骤A，针对每一数据集的各个属性分别生成属性的扩展；

步骤B，针对每个属性的扩展，考虑该属性的所有属性值类型的统计特性，从而确定该属性的数据类型；

步骤C，基于属性的数据类型，定义属性值的相似度，实现属性间的相似度计算；

步骤D，根据细粒度属性对齐的需要，针对任意两不同数据集要判别的属性对关系，基于属性间的相似度生成特征；

步骤E，将所述特征输入训练好的分类器，输出分类结果；

所述的步骤B包括：

步骤B1：确定属性值的数据类型，任意属性值l可看作由n个原子文本a_i拼接而成，其中n≥1，1≤i≤n，i，n均为正整数，任意属性值l的数据类型通常与其中一个或几个关键的原子文本的类型保持一致，使用如下启发式准则判断属性值l的数据类型：

其中I是指示函数，时为1，否则为0；g_L为求文本长度的函数，U为数据类型的集合；

步骤B2：确定属性的数据类型，采用下式，对属性p的所有属性值的数据类型进行统计，即计算每个类型出现次数占其属性值总数的比例，假定比例低于阈值θ的类型为噪声导致的错误，

其中，E_p表示属性p的扩展中所有实体构成的集合，l_e,p表示给定实体e和属性p时对应的属性值，代表属性值l_e,p的数据类型。

2.根据权利要求1所述的细粒度中文属性对齐方法，其特征在于，步骤A中属性的扩展是指在该属性所在的语义数据集中，所有该属性相关的实体和属性值对所构成的二元组集合。

3.根据权利要求1所述的细粒度中文属性对齐方法，其特征在于，所述的步骤C包括：

步骤C1：属性值相似度的计算，若给定两个属性值l₁和l₂的关键原子文本集合A₁和A₂及其最佳匹配集则属性值的相似度可由下式计算，

其中s_a函数用于求两个原子文本值的相似度；

步骤C2：基于属性值相似度计算属性的相似度，计算两个属性p₁和p₂相似度的公式如下：

其中，s_l为计算属性值相似度的函数，l_e,p表示给定实体e和属性p时对应的属性值。

4.根据权利要求1所述的细粒度中文属性对齐方法，其特征在于，所述的步骤D中，属性p₁和p₂分别来自任意两个数据集D₁和D₂，所述的步骤D生成特征包括：

针对所有关系的特征f₁＝s_p(p₁,p₂)；

针对相关关系的特征f₂＝s_p(p′₁,p₂),f₃＝s_p(p₁,p'₂)其中，p′₁是D₂中p₁同名的属性，p'₂是D₁中与p₂有同名的属性；

针对包含关系的特征

其中，M_p为属性p的扩展中所有实体类别的集合，c_e表示实体e的概念，

其中I是指示函数，满足条件时为1否则为0。

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于中国科学院电子学研究所，未经中国科学院电子学研究所许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/pat/books/201710077245.8/1.html，转载请声明来源钻瓜专利网。

上一篇：基于社保数据构建用户画像的方法和用户画像生成器
下一篇：一种基于多GRU层神经网络的推荐方法与系统

同类专利

专利分类

G06 计算；推算；计数
G06F 电数字数据处理

免登录下载普通用户下载升级VIP会员，免费下载

友情链接：交换友情链接需要网站权重大于4，网站收录10W以上，如符合条件，请联系QQ：。

关于我们寻求报道投稿须知广告合作版权声明网站地图友情链接企业标识联系我们

在线咨询

周一至周五 9:00-18:00

版权所有http://www.vipzhuanli.com/公布日期

咨询在线客服

咨询在线客服

tel code back_top