[发明专利]一种基于知识的自适应事件索引认知模型提取文档摘要的方法有效
申请号: | 201910425138.9 | 申请日: | 2019-05-21 |
公开(公告)号: | CN110188189B | 公开(公告)日: | 2021-10-08 |
发明(设计)人: | 陈向楠;刘东升;郑一明;陈鸿斌;陈佳佳;刘彦妮;陈亚辉 | 申请(专利权)人: | 浙江工商大学 |
主分类号: | G06F16/34 | 分类号: | G06F16/34;G06F40/295 |
代理公司: | 杭州裕阳联合专利代理有限公司 33289 | 代理人: | 姚宇吉 |
地址: | 310000 浙江省杭*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明提出了一种基于知识的自适应事件索引认知模型提取文档摘要的方法,属于自然语言处理和自动文本摘要生成领域。本方法重新定义了事件索引认知模型五类指标的概念、并在标准的人类记忆模型之上,运用了情感属性、核心影响两个维度来提取文档摘要;此方法紧密地反映人类理解文本的过程,在处理非结构化的、不完整的和模糊的文本内容有着独特优势;因此,适合用于涉及数据不确定性的各种场景和应用,包括机器学习、智能应用、图像处理和医疗诊断应用等。 | ||
搜索关键词: | 一种 基于 知识 自适应 事件 索引 认知 模型 提取 文档 摘要 方法 | ||
【主权项】:
1.一种基于知识的自适应事件索引认知模型提取文档摘要的方法,其特征在于,包括步骤:第一步:基于原有的KB‑EI认知模型,在学习阶段,读入多个文档,获得学习阶段的文本语料库;第二步:执行自然语言处理(NLP)任务,包括获取语料、语料清洗、句子检测、中文分词、词性标注、去停用词;第三步:从文本中进行特征提取、主题提取和命名实体识别,并采用共指解析定位和识别已标识的命名实体的表达式,为关系提取任务做铺垫;第四步:输入文档进行预处理并分别采用低歧义的girju因果短语和采用同义词意向、命名实体,以及从驻留在语义记忆知识库中学习并提取因果关系和意向关系,并用于创建文档中因果关系和意向关系的上下文;第五步:计算核心影响、情感属性,当一个事件结束时,如果一个关系的核心影响值大于语义记忆存储的阈值,那么将这个关系复制到附有情感的语义记忆中,然后使用核心影响的属性更新情景记忆中的关系,提取出的关系与核心影响附加在一起存储在情景记忆中;第六步:通过对因果关系和意向关系及其核心影响、情感属性对语义记忆知识库进行更新形成新的KB‑EI认知模型。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于浙江工商大学,未经浙江工商大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201910425138.9/,转载请声明来源钻瓜专利网。