[发明专利]作文评分方法、装置、计算机设备及计算机可读存储介质在审
| 申请号: | 202010687313.4 | 申请日: | 2020-07-16 |
| 公开(公告)号: | CN111832281A | 公开(公告)日: | 2020-10-27 |
| 发明(设计)人: | 阮鸿涛;郑立颖;徐亮;阮晓雯 | 申请(专利权)人: | 平安科技(深圳)有限公司 |
| 主分类号: | G06F40/205 | 分类号: | G06F40/205;G06F40/194 |
| 代理公司: | 深圳市精英专利事务所 44242 | 代理人: | 武志峰 |
| 地址: | 518000 广东省深圳市福田区福*** | 国省代码: | 广东;44 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 作文 评分 方法 装置 计算机 设备 可读 存储 介质 | ||
1.一种基于特征抽取及随机森林的作文评分方法,其特征在于,所述方法包括:
获取待评分的作文;
根据预设特征抽取方式抽取所述作文的目标特征,所述目标特征包括预设语言基础特征、预设逻辑特征及预设理解力特征,所述预设语言基础特征包括预设词汇特征、预设语法特征、预设句法特征、预设篇幅特征及预设可读性特征,所述预设逻辑特征包括预设文章结构特征、预设文章连贯性特征及预设文章元素特征,所述预设理解力特征包括与预设文章的相似度特征;
将所述目标特征输入经过预训练的预设随机森林模型进行评分,以得到所述作文所对应的分数。
2.根据权利要求1所述基于特征抽取及随机森林的作文评分方法,其特征在于,所述根据预设特征抽取方式抽取所述作文的目标特征的步骤包括:
根据预设语言基础特征抽取方式抽取所述作文的所述预设语言基础特征;
根据预设逻辑特征抽取方式抽取所述作文的所述预设逻辑特征;
根据预设理解力特征抽取方式抽取所述作文的所述预设理解力特征。
3.根据权利要求2所述基于特征抽取及随机森林的作文评分方法,其特征在于,所述根据预设语言基础特征抽取方式抽取所述作文的所述预设语言基础特征的步骤包括:
采用第一预设语言工具对所述作文进行分词,以得到所述作文所包含的短语;
基于所述短语,根据每个预设目标语言基础子特征抽取方式进行特征抽取,以得到每个目标语言基础子特征;
将得到的若干个目标语言基础子特征组成集合以得到所述预设语言基础特征。
4.根据权利要求2所述基于特征抽取及随机森林的作文评分方法,其特征在于,所述根据预设逻辑特征抽取方式抽取所述作文的所述预设逻辑特征的步骤包括:
根据所述作文中所包含的标点符号将所述作文切割为若干个句子;
基于所述句子,统计出所述作文的所述预设文章结构特征所对应的所述作文本所包含的元素个数、所述预设文章元素特征所对应的所有所述元素中单词数目的均值、所述预设文章连贯性特征所对应的相邻句子之间的重叠数量,其中,所述元素为所述作文中所包含的背景类、论点类、主要观点类、支撑观点类或者结论类别中,最大连续出现的类别的句子集合称为该类别的元素。
5.根据权利要求2所述基于特征抽取及随机森林的作文评分方法,其特征在于,所述根据预设理解力特征抽取方式抽取所述作文的所述预设理解力特征的步骤包括:
获取预设语料库中所包含的预设文章;
将所述作文与所述预设文章按照预设特征指标进行对比,以得到所述作文与所述预设文章的预设相似度。
6.根据权利要求5所述基于特征抽取及随机森林的作文评分方法,其特征在于,所述预设文章为若干篇文章,所述将所述作文与所述预设文章按照预设特征指标进行对比,以得到所述作文与所述预设文章的预设相似度的步骤之后,还包括:
从所述预设文章中获得与所述作文的相似度分数差距最小的最相似文章;
获取与所述最相似文章同属一个文章类别的得分指标为对比指标;
基于所述对比指标,将所述作文与得分最高的预设目标文章进行对比,以得到所述作文与所述预设目标文章之间的相似度。
7.根据权利要求5所述基于特征抽取及随机森林的作文评分方法,其特征在于,所述根据预设理解力特征抽取方式抽取所述作文的所述预设理解力特征的步骤还包括:
获取所述作文所对应的主题;
获取所述预设语料库中所述主题所包含的同主题文章,其中,所述同主题文章为与所述作文的主题相同的文章;
将所述作文与所述同主题文章进行相似度对比,以得到所述作文与所述同主题文章所对应类别的类别相似度。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于平安科技(深圳)有限公司,未经平安科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010687313.4/1.html,转载请声明来源钻瓜专利网。





