[发明专利]一种基于目标知识点的句群抽取方法及装置有效
申请号: | 201510859508.1 | 申请日: | 2015-11-30 |
公开(公告)号: | CN105512238B | 公开(公告)日: | 2019-06-04 |
发明(设计)人: | 成洪甲;叶茂;徐剑波 | 申请(专利权)人: | 北大方正集团有限公司;北京方正阿帕比技术有限公司;北京大学 |
主分类号: | G06F16/31 | 分类号: | G06F16/31;G06F17/27 |
代理公司: | 北京三聚阳光知识产权代理有限公司 11250 | 代理人: | 马永芬 |
地址: | 100871 北京市*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 一种基于目标知识点的句群抽取方法及装置,该方法包括如下步骤:获取知识点的精确属性;利用精确属性在待处理数字资源中抽取知识点的模糊属性;利用精确属性和模糊属性在待处理数字资源中进行知识点的句群挂接,获取知识点句群。通过加入知识点的精确属性和模糊属性,提高了知识点句群抽取的准确性。 | ||
搜索关键词: | 一种 基于 目标 知识点 抽取 方法 装置 | ||
【主权项】:
1.一种基于目标知识点的句群抽取方法,其特征在于,包括如下步骤:获取知识点的精确属性,所述精确属性是描述知识点具体属性的数据;利用所述精确属性在待处理数字资源中抽取知识点的模糊属性;在所述待处理数字资源中获取包含知识点的多个段落,根据所述精确属性分别计算每个段落的第一得分;根据所述第一得分将所述包含知识点的段落降序排序;按照排序结果从前提取预设数量的段落;对提取的所述段落进行分句;对包含知识点的分句以及其前后句子进行分词;对分词结果进行过滤;统计过滤后的分词词频并按照词频进行降序排列,并按照排序结果从前提取预设数量的分词作为该知识点的模糊属性;利用所述精确属性和所述模糊属性在所述待处理数字资源中进行知识点的句群挂接,获取知识点句群。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北大方正集团有限公司;北京方正阿帕比技术有限公司;北京大学,未经北大方正集团有限公司;北京方正阿帕比技术有限公司;北京大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201510859508.1/,转载请声明来源钻瓜专利网。