[发明专利]一种企业基本信息知识图谱的构建方法及系统在审
申请号: | 202210686880.7 | 申请日: | 2022-06-17 |
公开(公告)号: | CN114896423A | 公开(公告)日: | 2022-08-12 |
发明(设计)人: | 关皓天;张宏莉;王星;刘立坤;刘春雨;孟超;孙庆伟 | 申请(专利权)人: | 哈尔滨工业大学 |
主分类号: | G06F16/36 | 分类号: | G06F16/36;G06F40/295;G06N7/00;G06Q10/10 |
代理公司: | 黑龙江立超同创知识产权代理有限责任公司 23217 | 代理人: | 杨立超 |
地址: | 150001 黑龙*** | 国省代码: | 黑龙江;23 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 企业 基本信息 知识 图谱 构建 方法 系统 | ||
1.一种企业基本信息知识图谱的构建方法,其特征在于,包括以下步骤:
构建包含多个企业的企业信息、企业学术论文信息、企业专利信息的数据集;
在所述数据集中选择知识图谱架构中的实体、属性及实体间的关系;
对实体、关系、属性集合进行知识融合,完成实体-关系-实体或实体-属性-属性值的三元组建立过程,完成企业基本信息知识图谱的构建。
2.根据权利要求1所述的一种企业基本信息知识图谱的构建方法,其特征在于,还包括:利用构建完成的知识图谱,将三元组转换成谓词表示,并与马尔可夫逻辑网结构结合,完成知识推理。
3.根据权利要求1或2所述的一种企业基本信息知识图谱的构建方法,其特征在于,在所述数据集中选择企业、企业高管、持股信息记录、基金、机构、企业学术论文、企业专利信息作为知识图谱的实体,所述持股信息记录包括基金持股信息记录和机构持股信息记录;在所述数据集中选择各个实体的属性确定如下:
a.企业:公司名称、英文名称、董事长、主要股东、成立日期、主营业务、公司简介、员工人数、管理层人数、上市日期、发行量、发行价格、交易市场、联系电话、邮政编码、传真、电子邮箱、公司网址、注册地址、办公地址;
b.企业高管:高管姓名、高管职务、高管薪酬、高管年薪货币单位;
c.基金持股信息记录或机构持股信息记录:日期、持有者、持有份额、持股比例、变化率、份额变化、变化金额、占组合比;
d.企业学术论文:学术论文编号、学术论文标题、学术论文作者、论文摘要、公布日期;
e.企业专利信息:专利标题、专利申请编号、专利申请日期、专利公布日期、专利申请人。
4.根据权利要求3所述的一种企业基本信息知识图谱的构建方法,其特征在于,不同实体间的关系具体确定如下:企业和企业高管之间的关系为管理人员;企业和企业学术论文之间的关系为持有学术论文;企业和企业专利信息之间的关系为持有专利信息;企业和基金持股信息记录之间的关系为基金持股;企业和机构持股信息记录之间的关系为机构持股;基金和基金持股信息记录之间的关系为基金持股;机构和机构持股信息记录之间的关系为机构持股。
5.根据权利要求2所述的一种企业基本信息知识图谱的构建方法,其特征在于,所述马尔可夫逻辑网结构的学习流程为:
获取子句集合;
初始化学习权重和最优期望值;设置标志位等于0;
寻找最优子句,如果最优子句为空,则标志位加1,继续寻找;如果最优子句不为空,则添加最优子句到马尔可夫逻辑网中,并计算最优期望;
判断标志位的值是否等于2,等于2则结束,若不等于2则继续寻找最优子句;
其中,所述最优子句为子句与谓词连接后得到的最优子句;所述最优期望为评判子句与谓词连接的结果的评价标准,影响最终得出子句的权值大小。
6.一种企业基本信息知识图谱的构建系统,其特征在于,包括:
数据集获取模块,其配置成构建包含多个企业的企业信息、企业学术论文信息、企业专利信息的数据集;
知识图谱构建模块,其配置成在所述数据集中选择知识图谱架构中的实体、属性及实体间的关系;对实体、关系、属性集合进行知识融合,完成实体-关系-实体或实体-属性-属性值的三元组建立过程,完成企业基本信息知识图谱的构建。
7.根据权利要求6所述的一种企业基本信息知识图谱的构建系统,其特征在于,还包括知识推理模块,其配置成利用构建完成的知识图谱,将三元组转换成谓词表示,并与马尔可夫逻辑网结构结合,完成知识推理。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于哈尔滨工业大学,未经哈尔滨工业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210686880.7/1.html,转载请声明来源钻瓜专利网。