[发明专利]一种题目分类方法、装置、电子设备及存储介质在审
申请号: | 201811583166.5 | 申请日: | 2018-12-24 |
公开(公告)号: | CN109685137A | 公开(公告)日: | 2019-04-26 |
发明(设计)人: | 金霄然 | 申请(专利权)人: | 上海仁静信息技术有限公司 |
主分类号: | G06K9/62 | 分类号: | G06K9/62;G06N3/04 |
代理公司: | 北京品源专利代理有限公司 11332 | 代理人: | 孟金喆 |
地址: | 200331 上海市普陀*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 特征向量 神经网络分类器 题目分类 文本 存储介质 电子设备 融合 题目 图片 公式信息 精准分类 题目数据 拼接 标签 输出 | ||
本公开实施例公开了一种题目分类方法、装置、电子设备及存储介质,其中所述方法包括:对获取到的题目数据中的文本、公式和图片分别进行编码,得到所述文本、公式和图片各自对应的特征向量;将所述文本、公式和图片各自对应的特征向量进行拼接,得到融合特征向量,并将所述融合特征向量输入预先训练好的神经网络分类器,所述神经网络分类器输出题目分类标签。本公开实施通过提取并融合题目中的文本、图片和公式信息的特征,并将其输入到神经网络分类器中,以达到对题目进行自动精准分类的目的。
技术领域
本公开涉及在线教育领域,尤其涉及一种题目分类方法、装置、电子设备及存储介质。
背景技术
在K12(kindergarten through twelfth grade)教育的题库构建、智能测评、自适应学校等领域均需要对题目进行分类,以便更好地检测学生当前的学习水平和状态,并相应地实时调整学习活动和进程,帮助学生实现差异化和个性化的学习,通常可以根据题目的知识点、难度、题型等对题目进行分类。
针对题目的分类方法,现有的技术方案一般基于传统的短文本分类方法,通常其分类流程为利用分词工具对文本进行分词处理、提取特征、利用传统的分类器如SVM或RF进行分类。这类技术方案有如下问题:
1.K12教育中的题目往往连带着图片,如物理中的电路图,化学中的流程图,数学中的程序框图等,现有的文本分类方法无法利用图片中存在的特征。
2.K12教育中的题目基本存在着公式。公式作为一种特殊形式的文本,有着自己内在的结构和特殊性。现有的文本分类方法无法有效地利用公式中存在的信息进行分类。
公开内容
本公开实施例提供了一种题目分类方法、装置、电子设备及存储介质,以解决现有技术中传统的短文本分类方法无法有效利用题目中图片和公式,使得题目分类的准确度低的技术问题。
第一方面,本公开实施例提供了一种题目分类方法,包括:
对获取到的题目数据中的文本、公式和图片分别进行编码,得到所述文本、公式和图片各自对应的特征向量;
将所述文本、公式和图片各自对应的特征向量进行拼接,得到融合特征向量,并将所述融合特征向量输入预先训练好的神经网络分类器,所述神经网络分类器输出题目分类标签。
第二方面,本公开实施例还提供了一种题目分类装置,包括:
编码模块,用于对获取到的题目数据中的文本、公式和图片分别进行编码,得到所述文本、公式和图片各自对应的特征向量;
分类模块,用于将所述文本、公式和图片各自对应的特征向量进行拼接,得到融合特征向量,并将所述融合特征向量输入预先训练好的神经网络分类器,所述神经网络分类器输出题目分类标签。
第三方面,本公开实施例还提供了一种电子设备,包括:
一个或多个处理器;
存储装置,用于存储一个或多个程序,
当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现如本公开实施例中任一所述的题目分类方法。
第四方面,本公开实施例还提供了一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现如本公开实施例中任一所述的题目分类方法。
本公开实施例提供的一种题目分类方法、装置、电子设备及存储介质,通过对题目数据中的文本、公式和图片进行编码,并将编码后的文本、公式和图片各自对应的特征向量融合,基于融合后的特征向量,利用神经网络分类器题目进行自动、高效、准确的分类。
附图说明
图1a是本公开一实施例提供的一种题目分类方法的流程示意图;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海仁静信息技术有限公司,未经上海仁静信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811583166.5/2.html,转载请声明来源钻瓜专利网。