[发明专利]一种知识点重要度计算方法及装置在审
| 申请号: | 201410421888.6 | 申请日: | 2014-08-25 |
| 公开(公告)号: | CN105373547A | 公开(公告)日: | 2016-03-02 |
| 发明(设计)人: | 叶茂;汤帜;徐剑波;金立峰;马佳乐 | 申请(专利权)人: | 北大方正集团有限公司;北京方正阿帕比技术有限公司;北京大学 |
| 主分类号: | G06F17/30 | 分类号: | G06F17/30 |
| 代理公司: | 北京三聚阳光知识产权代理有限公司 11250 | 代理人: | 周美华 |
| 地址: | 100871 北京市*** | 国省代码: | 北京;11 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 知识点 重要 计算方法 装置 | ||
技术领域
本发明涉及一种电数字数据的分析方法,具体地说是一种领域知识点的重要度计算方法和系统。
背景技术
数字出版已成为出版业的发展趋势。人们已从纸质阅读大量地转向电子阅读。数字出版资源中的百科全书作为一种工具书,是对领域中知识点的简单总结。百科全书中的知识点(也称为词条或实体)通常比字典更加详细,描述了领域概念的相关内容。通过领域百科全书和其他数字出版资源,可以通过知识点方式组织知识,提供基于知识点的知识服务系统。
在现代社会,随着电子信息技术的发展,数字信息量日益增加,如何在目前庞大的信息数据中寻找有价值的信息显得尤其重要。针对某个领域,其中的各个知识点的重要程度不尽相同,因此如果能够获得各个知识点的重要程度,将重要的知识点优先推荐给用户,让用户对重要的知识点有针对性的进行学习,则可以大大提高信息的利用率。在此情况下,则需要衡量知识点的重要程度,用于阅读推荐或者基于知识点重要度的学习。
然而,目前对于知识的重要度,没有一种客观的度量标准。如果使用人工方式标注重要度,不仅耗费大量人力,同时由于不同的人知识背景不同,所标注的重要度的值也会不同,无法对数据信息的进行标准化的处理,也不利于对电子信息数据的统一管理。
发明内容
为此,本发明所要解决的技术问题在于现有技术中的知识点重要度需要人工标注、标准不统一、耗费较多人力的问题,从而提出一种无需人工标注、客观地度量知识点的重要度的方法和系统。
为解决上述技术问题,本发明提供一种知识点的重要度计算方法和系统。
一种知识点的重要度计算方法,包括如下步骤:
获取所有或部分知识点,作为知识点集合;
确定所述知识点集合中任意两个知识点之间的有向关系强度,得到知识点的关联度信息;
利用所述关联度信息进行迭代,确定所述知识点集合中每个知识点的重要度信息。
一种知识点的重要度计算装置,包括:
获取单元:获取所有或部分知识点,作为知识点集合;
关联度计算单元:确定所述知识点集合中任意两个知识点之间的有向关系强度,得到知识点的关联度信息;
重要度计算单元:利用所述关联度信息进行迭代,确定所述知识点集合中每个知识点的重要度信息。
本发明的上述技术方案相比现有技术具有以下优点,
(1)本发明提供一种知识点的重要度计算方法,首先,获取所有或部分知识点,作为知识点集合;然后,确定所述知识点集合中任意两个知识点之间的有向关系强度,得到知识点的关联度信息;最后,利用所述关联度信息进行迭代,确定所述知识点集合中每个知识点的重要度信息。该方案中考虑了该知识点到其他知识点的有向关系强度,以及其他知识点到该知识点的有向关系强度,通过这两种关系可以客观的表征该知识点和其他知识点之间的关系,客观的体现出该知识点的重要程度,为领域内知识点确定了一种客观的重要度评估标准。
(2)本发明所述的知识点的重要度计算方法,设置导航度的初始值;将所述关联度信息与所述导航度的值进行迭代,确定权威度信息和所述导航度的最终值;根据所述权威度信息和所述导航度的最终值,确定所述知识点集合中每个知识点的重要度信息。该方案中,通过权威度信息和导航度值进行迭代,来逐次逼近,不仅计算简单方便,而且充分考虑了该知识点与其他知识点的关系,客观的表征了该知识点在该领域内的重要程度。
(3)本发明所述的知识点的重要度计算方法,待测知识点的重要度为T=A×H,或T=A×H×r+e,T为知识点集合中每个知识点的重要度组成的重要度矩阵,H为导航度矩阵;A为权威度矩阵,r为比例系数,e为偏差校正系数,在上述基础上引入了比例系数r和偏差e,便于根据不同的情况来调整知识点的重要度,使得该知识点的重要度可以更加合理、客观的表达出。
(4)本发明所述的知识点的重要度计算方法,计算知识点间的关系强度时,根据各个知识点的名称和各个知识点对应的解释进行计算,名称是对该知识点含义的概括表达,而解释则是该知识点的具体内容和分析,通过名称和解释相结合,可以反应出该知识点所代表的意思,因此利用该知识点名称和解释进行关系强度的计算,可以客观、合理的体现出各个知识点之间的关系强度,为后续计算提供客观依据。
(5)本发明所述的知识点的重要度计算方法,抽取知识点的名称和解释的过程中,还包括对名称和解释中的数据进行预处理的过程,通过预处理删除特殊符号信息如书名号等,方便后续计算。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北大方正集团有限公司;北京方正阿帕比技术有限公司;北京大学,未经北大方正集团有限公司;北京方正阿帕比技术有限公司;北京大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201410421888.6/2.html,转载请声明来源钻瓜专利网。





