[发明专利]一种汉语二语作文自动评分方法在审
| 申请号: | 202110896135.0 | 申请日: | 2021-08-05 |
| 公开(公告)号: | CN113569560A | 公开(公告)日: | 2021-10-29 |
| 发明(设计)人: | 胡韧奋;王予沛;彭一平;宾帅 | 申请(专利权)人: | 北京师范大学 |
| 主分类号: | G06F40/211 | 分类号: | G06F40/211;G06F40/253;G06F40/289;G06N3/04;G06N3/08;G06Q10/06;G06Q50/20 |
| 代理公司: | 北京京万通知识产权代理有限公司 11440 | 代理人: | 刘浩;许天易 |
| 地址: | 100875 北*** | 国省代码: | 北京;11 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 汉语 作文 自动 评分 方法 | ||
本发明提出一种汉语二语作文自动评分方法,包括抽取作文的语言特征、多粒度文本表示特征和切题特征;将所述语言特征输入评分模型,获得分数,其中,语言特征包括语言复杂度特征、语言偏误特征。本发明针对汉语二语评分设计了较为全面的、多维度的作文评分显式特征集,并通过有序逻辑回归分析获得评价模型,该评价模型的评分与人类评分员评分有较好的一致性和相关性,可以科学、高效地衡量汉语二语作文的质量和水平。
技术领域
本发明涉及人工智能技术领域,更具体地,涉及一种汉语二语作文自动评分方法。
背景技术
随着中国经济快速发展和国际地位的日益提高,世界范围内学习汉语的人数不断增加,汉语二语教学受到了越来越多的关注。在二语教学中,写作是一个核心模块,因为作文可以综合反映写作者词汇、句法、行文组织等多个方面的语言知识水平及运用能力。随着自然语言处理技术及相关语言资源的发展,写作能力测试及评估逐步向信息化、智能化发展。
美国教育考试服务中心(ETS)自1999年以来便开始使用作文自动评分系统,并陆续于2003年和2006年发布了更新版本,之后也一直在优化相应系统,该系统已被广泛应用于GMAT、托福等考试中作文的备考和批改。该系统包含两个功能,一个是评分引擎,主要实现自动对学生作文进行评分;另一个是反馈模块,对作文的词汇、语法错误进行评估并提供反馈,并且支持识别文章的语篇结构和不良的文体特征等。系统从训练数据中抽取了50多个特征,使用逐步线性回归来选择对作文分数预测有显著贡献的特征。对于每个作文题目,训练得到一个回归方程。将相应主题下新作文的对应特征值带入方程便可得到该作文分数的预测值,将其四舍五入得到一个整数分数。
中国科学院自动化所于2011年开发了一种面向少数民族汉语水平考试(MHK)作文的自动评分模型。该模型对ETS的词汇评分机制进行了改进,并在词汇评分的基础上,抽取了与主题内容和文章条理相关的一些简单特征,建立了较为全面的少数民族汉语作文评分体系。
新加坡国立大学的Taghipour和Ng在2016年在英文ASAP作文数据集的基础上开发了一种基于卷积神经网络(CNN)和循环神经网络(LSTM)的作文自动评分模型,该模型隐式地抽取作文特征抽取,以神经网络各层参数的形式将学习到的特征保存下来,作为评分的依据,该模型简单而有效,后续很多基于神经网络的作文自动评分的模型都是在该模型的基础上改进得到的。
哈工大讯飞联合实验室在2020年开发了一种面向中国高考作文评分的弱监督预训练作文自动评分模型。该方法采用多阶段预训练,结合多层次的监督策略,首先进行大规模粗评分有监督训练,然后引入跨主题作文训练,最后针对目标主题的数据展开训练。通过这种多阶段迁移学习的手段,大大降低了模型的训练数据成本。
北京语言大学于2020年开发了一种面向汉语二语学习者的作文自动评分系统。其设计了词汇水平、切题程度、句型难度、表达准确度、篇幅长度等特征来衡量写作质量,并提供错误点评和词汇拓展两个反馈功能。
在特征利用的层面上,目前的模型或者是隐式利用特征,或者是显式利用特征。隐式利用特征的现有技术,往往不具有可解释性或可解释性较差;显式利用特征的现有技术,往往挖掘的显性特征较少或较浅层,难以全面、准确地描述作文特点。同时,现有的研究方法主要面向母语作文评分,个别涉及少数民族和二语作文评分,在特征设计上均未考虑到汉语二语写作的特点。
另外,现有的方法大部分需要区分作文主题构建自动评分模型,这使得模型在面对新题目的作文时,因为难以获得足够的与新题目相关的训练数据,而难以处理。
发明内容
为克服现有技术的上述缺陷,本发明意在构建一套多层次的显式特征和对新主题不敏感的模型,充分考虑汉语二语习得中的重点和难点,以更好地服务于汉语二语作文的质量评估,适用于日常话题下各种主题的议论文和记叙文评分。
根据本发明,提出了一种汉语二语作文自动评分方法,包括:
S1、抽取作文的语言特征;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京师范大学,未经北京师范大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110896135.0/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种室内装饰石材铺设设备及工艺
- 下一篇:一种电磁推力器结构及其应用





