[发明专利]一种文章立意的分析及文章评分方法、装置在审
| 申请号: | 201811625903.3 | 申请日: | 2018-12-28 |
| 公开(公告)号: | CN109710940A | 公开(公告)日: | 2019-05-03 |
| 发明(设计)人: | 巩捷甫;付瑞吉;宋巍;王士进;胡国平;秦兵;刘挺 | 申请(专利权)人: | 安徽知学科技有限公司 |
| 主分类号: | G06F17/27 | 分类号: | G06F17/27;G06N3/04 |
| 代理公司: | 北京集佳知识产权代理有限公司 11227 | 代理人: | 杨华;王宝筠 |
| 地址: | 230031 安徽省合肥市高新区望*** | 国省代码: | 安徽;34 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 分析方法及装置 多元分类 二分类 申请 分析 | ||
本申请提供了一种文章立意的分析方法及装置,先排除低等立意的文章,再判别待评阅文章的立意等级是中等还是高等,二分类与多元分类相比,类型判别的准确性能够大大提高,从而提高立意判别的准确性。
技术领域
本申请涉及自然语言理解领域,尤其涉及一种文章立意的分析及文章评分方法、装置。
背景技术
文章的立意是指文章所确立的文意。随着对于机器理解的深入发展,通过机器判别文章的立意,成为越来越显著的需求。
现有的自动检测文章立意的方法,使用通用分类模型将文章立意分为高等、中等和低等三类。但研究发现,现有的多元(大于两类)分类模型确定的类别通常是比例相当的,所以,现有的自动检测文章立意的方法,极容易发生误判,例如,将中等立意的文章判别为低等立意,因此,识别的准确性有待提高。
发明内容
本申请提供了一种文章立意的分析方法及装置,目的在于解决立意分类准确性不高的问题。本申请还提供了一种文章评分方法,基于文章立意的分析方法,目的在于提高文章评分的准确性。
为了实现上述目的,本申请提供了以下技术方案:
一种文章立意的分析方法,包括:
获取待评阅文章;
依据预设特征,判断所述待评阅文章是否为低等立意类型;
在所述待评阅文章不是低等立意类型的情况下,判别待评阅文章为高等立意类型或中等立意类型。
可选的,所述判断所述待评阅文章是否为低等立意类型包括:
依据预设特征,判断所述待评阅文章是否为低等立意类型,所述预设特征包括词特征、句特征和篇章特征的至少一个;
所述在所述待评阅文章不是低等立意类型的情况下,判别待评阅文章为高等立意类型或中等立意类型包括:
若所述待评阅文章不是低等立意类型,利用二元分类模型判别所述待评阅文章为高等立意类型或中等立意类型;其中二元分类模型为预先训练的神经网络二分类模型,用于计算所述待评阅文章的句向量和文章向量,得出所述待评阅文章的立意类型。
可选的,所述依据预设特征,判断所述待评阅文章是否为低等立意类型,包括以下至少一个步骤:
在所述待评阅文章中的目标词的权重大于第一阈值的情况下,判定所述待评阅文章为低等立意类型;
在所述待评阅文章中的消极句的数量大于第二阈值的情况下,判定所述待评阅文章为低等立意类型;
在所述待评阅文章的情感类型不属于预设的积极类型的情况下,判定所述待评阅文章为低等立意类型;
在所述待评阅文章为流水账的情况下,判定所述待评阅文章为低等立意类型。
可选的,计算所述待评阅文章中的目标词的权重的方法包括:
计算所述待评阅文章中的目标词在预设的词语库中的权重分数之和,得到所述权重,所述目标词为包括在所述词语库中的词。
可选的,识别所述待评阅文章的情感类型不属于预设的积极类型的方法包括:
获取所述待评阅文章的情感词向量,利用所述情感词向量与预设的多维情感词极性表的对比结果确定所述待评阅文章的情感类型不属于预设的积极类型;
其中,确定所述待评阅文章的情感类型不属于预设的积极类型的方法为,使用预设的第一模型将所述情感词向量比对所述多维情感词极性表的评分确定。
可选的,所述判别待评阅文章为高等立意类型或中等立意类型包括:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于安徽知学科技有限公司,未经安徽知学科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811625903.3/2.html,转载请声明来源钻瓜专利网。
- 上一篇:用于确定主题的方法和装置
- 下一篇:基于人工智能的用户意图识别方法和装置





