[发明专利]一种知识萃取的方法及系统有效
申请号: | 201810931119.9 | 申请日: | 2018-08-15 |
公开(公告)号: | CN109086440B | 公开(公告)日: | 2021-09-07 |
发明(设计)人: | 江焕勇 | 申请(专利权)人: | 深圳至宝网络科技有限公司 |
主分类号: | G06F16/35 | 分类号: | G06F16/35;G06F16/31;G06F40/18;G06Q50/20 |
代理公司: | 深圳市中科创为专利代理有限公司 44384 | 代理人: | 梁炎芳;谢亮 |
地址: | 518000 广东省深圳市罗*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 知识 萃取 方法 系统 | ||
本发明公开了一种知识萃取的方法,包括如下步骤:S1,通过文字录入技术、语音录入技术或视频录入技术将个人或者组织经验转化为电子化中间知识,并通过网络传输协议上传至服务器;S2,根据中间知识所包含的内容结构要素对中间知识进行分类;S3,萃取中间知识中的核心知识点,建立核心知识点的知识点清单;S4,应用知识萃取工具,对知识点清单中的内容结构要素进行结构化,形成一般性知识,并通过网络传输协议上传至服务器。本发明创新点在于:将知识进行分类,并据此找到知识之间内在的规律和结构要素规律,避免缺乏结构带来的知识偏误和知识缺失。
技术领域
本发明涉及网络资源的学习、分享与应用的技术领域,特别涉及一种知识萃取的方法及系统。
背景技术
当今社会,互联网已经渗透到人们的日常生活中,越来越多的人从互联网上汲取外界知识,如通过网络电子课程来学习知识。在网络时代,知识大都被电子化为文档、音频、或者视频信息存在网络服务器中,人们可以通过直接的浏览进行快速学习。然而,知识除了可以直接通过一定形式的信息(如word文档、视频)进行汲取外,还有一些组织、个人经验等隐性知识可以为人们所使用。现有的隐性知识转化为显性知识材料的典型方法为是通过使用文档编辑器(如MS office word)编写最佳实践经验的过程及概括性原则总结,这种萃取知识的方法存在以下缺陷:
1、萃取的知识不完整
编写实践案例仅仅适用于包含有流程步骤和解决方案的知识,而大量的信息类、工具类、概念类、原理类的知识并不能得到萃取和提炼。
2、萃取的知识缺乏结构
不同的人,对于个人经验所包含的知识的要素理解存在个体差异,导致萃取的知识良莠不齐,完整度存在不同程度的缺失。
3、萃取的知识不具有普遍的适用性
个人编写实践案例或总结经验,带有个人的认知偏误,总结出来的显示知识适用性存疑,主要原因是传统知识萃取的方法是简单的归纳法,这种方法从个别经验上升为一般性知识,缺乏验证证伪环节。
发明内容
针对现有技术存在的问题,本发明的主要目的是提供一种知识萃取的方法,皆在实现对隐性知识的显性化和稳定的产出。
为实现上述目的,本发明提出的知识萃取的方法,其包括如下步骤:
S1,通过文字录入技术、语音录入技术或视频录入技术将个人或者组织经验转化为电子化中间知识,并通过网络传输协议上传至服务器。其中,中间知识包括经验产生的若干条件步骤以及产生的最终结果。
S2,根据中间知识所包含的内容结构要素对中间知识进行分类。其中,中间知识分为四类:信息数据、概念、原理原则以及过程方法,信息数据指不需要解释的事实信息,概念指类别、专有名词、术语以及各类标签信息,原理原则指包含条件因子、结果、以及条件因子与结果之间的关系,过程方法指实现一个结果的流程步骤信息。
S3,萃取中间知识中的核心知识点,具体包括如下步骤:
S31,提取中间知识每一条件步骤以及最终结果中所包含的内容结构要素,并根据步骤S2中对中间知识的分类方法对中间知识每一条件步骤以及最终结果的内容结构要素进行分类。
S32,根据中间知识类型向下包含的原则,建立每一条件步骤以及最终结果的核心知识点的知识点清单。
S4,应用知识萃取工具,对知识点清单中的内容结构要素进行结构化,形成一般性知识,并通过网络传输协议上传至服务器。
优选地,步骤S31中,提取中间知识每一条件步骤以及最终结果中所包含的内容结构要素时,还包括:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于深圳至宝网络科技有限公司,未经深圳至宝网络科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810931119.9/2.html,转载请声明来源钻瓜专利网。
- 上一篇:信息推荐方法及装置
- 下一篇:用于在线答题的智能推荐方法及系统