[发明专利]基于领域知识图谱的评价方法及系统有效
申请号: | 202110527629.1 | 申请日: | 2021-05-14 |
公开(公告)号: | CN113204650B | 公开(公告)日: | 2022-03-11 |
发明(设计)人: | 郑传双;樊向东;韩红玉;万享 | 申请(专利权)人: | 深圳市曙光信息技术有限公司 |
主分类号: | G06F16/36 | 分类号: | G06F16/36;G06F40/242;G06F40/247;G06F40/289 |
代理公司: | 深圳市科吉华烽知识产权事务所(普通合伙) 44248 | 代理人: | 胡吉科 |
地址: | 518000 广东省深*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 领域 知识 图谱 评价 方法 系统 | ||
一种基于领域知识图谱的评价方法及系统包括针对待评估DKG获取该领域核心期刊和普通期刊;对DKG三元组三元素进行扩展形成三元组扩展集合Wi;若三元组匹配出现在文献的一个句子中作强相关计数ST1;若同一句中只出现三元组中两个元素作不一致计数ST2;若三元组中两个及以上元素在一个段落中作弱相关计数ST3;V=[v1,v2,v3]表示三元组与文献的关联程度,三元组与文献相关强度量s=||α1v1||+||α2v2||+||α3v3||;三元组质量q=||α1v1||‑||α2v2||;上述方法及系统直接用三元组与文本进行匹配,省去从文本中提取三元组的过程,且不用考虑两个三元组间关系。
技术领域
本发明涉及知识图谱评价领域,特别涉及一种基于领域知识图谱的评价方法及系统。
背景技术
知识图谱是人工智领域近来一个发展迅速的分支。因为通过知识图谱可以让机器掌握和使用知识,具备认知智能,从而为人工智能更深层、更广泛的应用打开了大门。领域知识图谱(Domain Knowledge Graph,简称DKG)虽然较通用知识图谱(General KnowledgeGraph,简称GKG)范围有限,但因其数据质量高、贴近行业应用而有可能成为最先落地的技术。目前在金融、医疗、农业和法律等领域的行业知识图谱都取得了不错的应用效果。其中也包括了用行业知识图谱去评价已有的技术成果,比如现有技术中一种利用医疗知识图谱对医生开具的处方进行评价。而对知识图谱本身如何评价的问题也一直存在。耗费大量人力物力等各种资源建立的这个庞大数据集到底如何?不论是作为知识图谱的构建方还是知识图谱的使用方,都是非常关心的。
现有技术对知识图谱的评价认为主要包括三方面:规模、质量和实时。其中实时是指知识图谱是否跟上了知识本身的更新,而对质量细分了三个指标:正确率、知识的深度和知识粒度,但一般只是作了学术上的定性分析,未提供可操作的实施方法。此外现有技术中一种知识图谱的评价方法和装置,仅针对使用者个人知识图谱作评价,并且要与一个已知的科学知识图谱作比对。更像是一个人对自己掌握知识的完善程度的自测。另一种是基于知识图谱的智能问答系统并对问答系统的性能进行了评价。虽然知识图谱的规模和质量好坏对问答系统的评价有影响,但这种评价引入了问答系统的设计、内容选取和问答结果评价等额外环节,显然不能简单地将问答系统的表现作为对知识图谱本身的客观评价。
发明内容
基于此,有必要提供一种有效的基于领域知识图谱的评价方法。
同时,提供一种可有效进行评价的基于领域知识图谱的评价系统。
一种基于领域知识图谱的评价方法,包括:
获取文献:针对待评估的领域知识图谱DKG,获取该领域最近N年的核心期刊和普通期刊文献;
扩展:对待评估的领域知识图谱DKG三元组i的三元素h,r,t进行扩展,实体词h扩展后得到H1,实体词t扩展后得到T1,关系词r扩展后得到R1,扩展后组合形成三元组i扩展集合Wi,若H1有m个元素、T1有n个元素、R1有p个元素,通过组合产生Ki=m×n×p个三元组,将三元组扩展集合Wi中的各个三元组的实体词和关系词提取出来并去重后形成领域专业词典C,若DKG中的三元组个数为Z,则扩展后的三元组个数M为y的取值范围从1-Z;
匹配:对获取核心期刊和普通期刊中的文章进行分词,对分词后的文章,采用三元组i扩展集合Wi中的任一三元组的三个元素进行匹配,若任一三元组i匹配在文章的一个句子中,作强相关计数ST1;若文章的同一句中只出现三元组i中任意两个元素,根据已匹配的两个元素对三元组i扩展集合Wi进行检索,若三元组i中的剩下的一个元素不能匹配,作不一致计数ST2;若任一三元组i中的三个元素出现在文章的一个段落中或其中任两个元素分散在一个段落中,作弱相关计数ST3;对分词后的文章,三元组扩展集合Wi中所有三元组都要进行匹配;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于深圳市曙光信息技术有限公司,未经深圳市曙光信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110527629.1/2.html,转载请声明来源钻瓜专利网。