[发明专利]一种基于自然语言生成技术的知识图谱辅助理解系统有效
申请号: | 201910629843.0 | 申请日: | 2019-07-12 |
公开(公告)号: | CN110347798B | 公开(公告)日: | 2021-06-01 |
发明(设计)人: | 李劲松;吕可伟;尚勇;周天舒 | 申请(专利权)人: | 之江实验室 |
主分类号: | G06F16/33 | 分类号: | G06F16/33;G06F16/36 |
代理公司: | 杭州求是专利事务所有限公司 33200 | 代理人: | 刘静 |
地址: | 310023 浙江省杭州市余*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开了一种基于自然语言生成技术的知识图谱辅助理解系统,该系统包括知识图谱选择模块、知识图谱翻译模块和结果展示模块;本发明利用自然语言生成技术将知识图谱转换为自然语言文本,方便领域专家在不了解知识图谱的源代码和软件的基础上,在使用知识图谱前,对于其领域的知识图谱有准确、深入且全面的了解。同时每一个短句与知识图谱本身对应的源代码相关联,如果发现知识图谱存在的冗余和错误信息,可以及时对其进行纠正,且该方法通用性较强。本发明利用可视化方法进一步加快领域专家对于知识图谱的理解。 | ||
搜索关键词: | 一种 基于 自然语言 生成 技术 知识 图谱 辅助 理解 系统 | ||
【主权项】:
1.一种基于自然语言生成技术的知识图谱辅助理解系统,其特征在于,该系统包括知识图谱选择模块、知识图谱翻译模块和结果展示模块;所述知识图谱选择模块用于获取符合RDF或OWL语法规范的目标知识图谱;所述知识图谱翻译模块:首先提取目标知识图谱的三元组,对提取的三元组进行字符串分割得到三个动态数组:主语数组、谓语数组、宾语数组,三者之间具有一一对应关系,然后通过嵌套循环,利用simplenlg工具对主语、谓语和宾语进行组装,形成一句完整的短句;同时对于主语‑谓语‑宾语的关系存在一对一对多和一对多对多的情况,在谓语数组和宾语数组中加入特殊字符进行标识,以确定该谓语对应某一主语以及该宾语对应某一主语和某一谓语,然后在嵌套循环中判断这些特殊字符以确定主语、谓语、宾语的对应关系,利用simplenlg工具对对应的主语、谓语和宾语进行组装,形成一个完整的长句;其中注解部分对应的三元组不单独成句,而是作为补充其他句子的注解信息;然后将目标知识图谱翻译成短句和长句,句子得到进一步规范后被存入本地数据库中,并从主语、谓语、宾语三个动态数组中选出类与子类、类与实例关系的内容组装成JSON格式的文件;所述结果展示模块从本地数据库调取目标知识图谱的翻译内容,将翻译内容以及目标知识图谱的源文件进行共同展示,同时获取JSON格式的文件,通过可视化工具绘制树状图,对知识图谱中的类与子类以及类与实例的层级结构进行可视化展示。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于之江实验室,未经之江实验室许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201910629843.0/,转载请声明来源钻瓜专利网。