[发明专利]一种企业基本信息知识图谱的构建方法及系统在审
申请号: | 202210686880.7 | 申请日: | 2022-06-17 |
公开(公告)号: | CN114896423A | 公开(公告)日: | 2022-08-12 |
发明(设计)人: | 关皓天;张宏莉;王星;刘立坤;刘春雨;孟超;孙庆伟 | 申请(专利权)人: | 哈尔滨工业大学 |
主分类号: | G06F16/36 | 分类号: | G06F16/36;G06F40/295;G06N7/00;G06Q10/10 |
代理公司: | 黑龙江立超同创知识产权代理有限责任公司 23217 | 代理人: | 杨立超 |
地址: | 150001 黑龙*** | 国省代码: | 黑龙江;23 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 企业 基本信息 知识 图谱 构建 方法 系统 | ||
本发明提供了一种企业基本信息知识图谱的构建方法及系统。所述构建方法包括:首先,对于包含公司基本信息的网站进行数据爬虫,采集完成知识图谱所需的相关数据;其次,对构建完成的数据集进行知识抽取:实体抽取、关系抽取、属性抽取,从复杂的数据集中明确研究对象;然后,对得到的实体、关系、属性集合进行知识融合,完成实体‑关系‑实体或者实体‑属性‑属性值的三元组建立,完成知识图谱的构建过程,并利用构建完成的知识图谱与马尔可夫逻辑网结构学习结合完成知识推理。本发明搭建了一个小型知识图谱,不仅制作了一个包含企业信息的“百科知识库”,并且可进一步利用谓词表示及马尔可夫逻辑网对缺失信息的企业的各方面信息进行准确预测。
技术领域
本发明涉及知识图谱构建技术领域,具体涉及一种企业基本信息知识图谱的构建方法及系统。
背景技术
由于无处不在的商业风险,所以企业在进行项目合作、挑选合作伙伴时需要了解合作方的运营状况、失信记录、企业资产、专利申请情况、经营规模、财务信息、高管信息、违规记录等企业全方位的信息,并将其作为是否合作的参考依据。同时,如果一个企业对自身各种信息了如指掌,在企业决策方面也可以作为重要依据。对于国家而言,了解全面企业的各方面信息有利于对企业的监管,比如企业的缴税情况。以企业基本信息为主要内容所构建的领域类知识图谱可以将这些信息高效完整的保存下来,并依托知识图谱进行知识推理等其他工作。
国外学者Hook对知识图谱进行了以下的应用总结:认为知识图谱有四个目的(发现、理解、交流、教育)和六方面的应用(特定领域微观展示、学科宏观可视化、协助教育者课程教学、协调保存文献知识、便于利用数字图书馆、展示知识传播)。虽然近年来知识图谱理论和实践不断发展进步,各种知识图谱应用层出不穷,但大多数公开的研究主要是理论或总结性地说明知识图谱构建中的一个环节或方面,企业知识图谱方面研究较少。
发明内容
本申请的目的在于克服上述问题或者至少部分地解决或缓减解决上述问题。
根据本发明的一方面,提供一种企业基本信息知识图谱的构建方法,该方法包括以下步骤:
构建包含多个企业的企业信息、企业学术论文信息、企业专利信息的数据集;
在所述数据集中选择知识图谱架构中的实体、属性及实体间的关系;
对实体、关系、属性集合进行知识融合,完成实体—关系—实体或实体—属性—属性值的三元组建立过程,完成企业基本信息知识图谱的构建。
进一步地,还包括:利用构建完成的知识图谱,将三元组转换成谓词表示,并与马尔可夫逻辑网结构结合,完成知识推理。
进一步地,在所述数据集中选择企业、企业高管、持股信息记录、基金、机构、企业学术论文、企业专利信息作为知识图谱的实体,所述持股信息记录包括基金持股信息记录和机构持股信息记录;在所述数据集中选择各个实体的属性确定如下:
a.企业:公司名称、英文名称、董事长、主要股东、成立日期、主营业务、公司简介、员工人数、管理层人数、上市日期、发行量、发行价格、交易市场、联系电话、邮政编码、传真、电子邮箱、公司网址、注册地址、办公地址;
b.企业高管:高管姓名、高管职务、高管薪酬、高管年薪货币单位;
c.基金持股信息记录或机构持股信息记录:日期、持有者、持有份额、持股比例、变化率、份额变化、变化金额、占组合比;
d.企业学术论文:学术论文编号、学术论文标题、学术论文作者、论文摘要、公布日期;
e.企业专利信息:专利标题、专利申请编号、专利申请日期、专利公布日期、专利申请人。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于哈尔滨工业大学,未经哈尔滨工业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210686880.7/2.html,转载请声明来源钻瓜专利网。