[发明专利]一种基于深度学习和规则结合的议论文结构分析方法在审
申请号: | 202011098179.0 | 申请日: | 2020-10-14 |
公开(公告)号: | CN112214988A | 公开(公告)日: | 2021-01-12 |
发明(设计)人: | 赵铁军;刘田澍;李岳;史桦兴;王晓文 | 申请(专利权)人: | 哈尔滨福涛科技有限责任公司 |
主分类号: | G06F40/205 | 分类号: | G06F40/205;G06F40/289;G06N3/04 |
代理公司: | 哈尔滨市阳光惠远知识产权代理有限公司 23211 | 代理人: | 刘景祥 |
地址: | 150086 黑龙江省哈尔滨市南岗区学府路25*** | 国省代码: | 黑龙江;23 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 深度 学习 规则 结合 议论文 结构 分析 方法 | ||
本发明公开了一种基于深度学习和规则结合的议论文结构分析方法,所述方法包括以下步骤:S1、输入作文题目和正文,使用议论文结构标签组分析系统;S2、对议论文正文分句,并保留句子的段落信息;S3、对正文所有句子进行分类,获得句子在全文中的作用;S4、识别及调整结构标签,获得议论文结构分析的结果。本发明针对当前缺少完整的议论文结构体系的现状,设计了一套完整的议论文结构体系,并利用深度学习和规则结合的方法,可以自动对议论文结构进行分析,无需人工处理,大大加快了议论文结构分析的速度,节省了人力成本。
技术领域
本发明涉及一种基于深度学习和规则结合的议论文结构分析方法,属于作文分析技术领域。
背景技术
作文结构分析是对段落、句子等作文组成部分进行其在全文结构或内容上的作用进行分析,获得彼此间内在联系的过程。目前的自然语言处理领域中没有专门的议论文结构分析任务,但议论文的结构分析与篇章分析有着很大相似之处。篇章分析需要利用上下文信息,根据目的将篇章分为细粒度级别不同的篇章单元,篇章结构则通过对篇章单元以及篇章单元之间的关系进行表示。篇章结构理论大体上可以分为篇章修辞结构体系和篇章话题结构体系,前者主要体现了篇章的连贯性,它认为篇章是由某种篇章基本构成单元通过递归组合,形成不同的层次,并通过层次之间的关系形成一种修辞上的层次化结构;而后者主要体现了篇章的衔接性,认为一篇文章有一个主话题,其由多个次级话题组成,同时,次级话题又可以由更下一级的话题组成,是一种话题关系上的层次化结构。
目前在自然语言处理领域以及语言学领域中,议论文结构分析相关研究存在着以下不足:
1.由于语文水平不同,人工分析难以使用统一的角度及标准对议论文进行结构分析;
2.目前缺少对议论文的段落、句子等组成部分在全文中作用的分析,缺少相应的结构体系;
3.由于缺少议论文结构体系,目前的自动作文分析系统无法对议论文结构进行细致分析。
发明内容
本发明的目的是提出一种基于深度学习和规则结合的议论文结构分析方法,以解决现有技术存在的问题。
一种基于深度学习和规则结合的议论文结构分析方法,所述方法包括以下步骤:
S1、输入作文题目和正文,使用议论文结构标签组分析系统;
S2、对议论文正文分句,并保留句子的段落信息;
S3、对正文所有句子进行分类,获得句子在全文中的作用;
S4、识别及调整结构标签,获得议论文结构分析的结果。
进一步的,在S2中,对议论文正文分句时,具体的,根据换行符或预先设计的分割符对段落进行分割,在获得句子时,根据常用的句尾标点符号对句子进行分割,在分句时如果出现常见句尾标点符号出现在单引号或双引号前的情况,将该标点符号后的引号划分到该句中。
进一步的,在S2中,保留句子的段落信息时,具体的,将全文分句结果储存为一个list,list的第i个元素为第i段的句子集合。
进一步的,在S1中,结构标签组包括13个标签,具体为:总起全文、承上启下、总结全文、提出中心论点、提出分论点、举例论证、名人名言、深入分析、联系现实、现身说法、表达观点、讲述事件和从现实出发,
其中,当识别出首段、无标签的中间段以及尾段时,分别添加“总起全文”、“承上启下”、“总结全文”三个结构标签;
当识别出提出中心论点的语句时,添加“提出中心论点”结构标签;
当识别出从几个不同的侧面提出分论点的语句时,添加“提出分论点”结构标签;
当识别出举例论证相关内容的语句时,添加“举例论证”结构标签;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于哈尔滨福涛科技有限责任公司,未经哈尔滨福涛科技有限责任公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011098179.0/2.html,转载请声明来源钻瓜专利网。