[发明专利]一种题目分类方法、装置、电子设备及存储介质在审
申请号: | 201811583166.5 | 申请日: | 2018-12-24 |
公开(公告)号: | CN109685137A | 公开(公告)日: | 2019-04-26 |
发明(设计)人: | 金霄然 | 申请(专利权)人: | 上海仁静信息技术有限公司 |
主分类号: | G06K9/62 | 分类号: | G06K9/62;G06N3/04 |
代理公司: | 北京品源专利代理有限公司 11332 | 代理人: | 孟金喆 |
地址: | 200331 上海市普陀*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 特征向量 神经网络分类器 题目分类 文本 存储介质 电子设备 融合 题目 图片 公式信息 精准分类 题目数据 拼接 标签 输出 | ||
1.一种题目分类方法,其特征在于,所述方法包括:
对获取到的题目数据中的文本、公式和图片分别进行编码,得到所述文本、公式和图片各自对应的特征向量;
将所述文本、公式和图片各自对应的特征向量进行拼接,得到融合特征向量,并将所述融合特征向量输入预先训练好的神经网络分类器,所述神经网络分类器输出题目分类标签。
2.根据权利要求1所述的方法,其特征在于,在对获取到的所述题目数据中的文本、公式和图片分别进行编码之前,所述方法还包括:
基于语法编译器,将所述题目数据中的公式解析成语法树;
相应的,对题目数据中的公式进行编码,得到公式对应的特征向量,包括:
通过树形多层反馈神经网络对输入的所述语法树进行特征提取,将所述语法树编码成公式特征向量;或
根据预设的教研规则在语法树上抽取多个预先定义的特征,并对所述多个预先定义的特征进行独热编码。
3.根据权利要求2所述的方法,其特征在于,所述基于语法编译器,将所述题目数据中公式解析成语法树,包括:
从所述题目数据中提取公式,并将公式转换成预设格式的公式;
基于语法编译器,将转换后的预设格式的公式解析成语法树。
4.根据权利要求1所述的方法,其特征在于,对获取到的所述题目数据中的文本进行编码,包括:
通过多层反馈神经网络或卷积神经网络对输入的文本进行特征提取,将所述文本编码成文本特征向量。
5.根据权利要求1所述的方法,其特征在于,对获取到的所述题目数据中的图片进行编码,包括:
通过卷积神经网络对输入的图片进行特征提取,将所述图片编码成图片特征向量。
6.一种题目分类装置,其特征在于,所述装置包括:
编码模块,用于对获取到的题目数据中的文本、公式和图片分别进行编码,得到所述文本、公式和图片各自对应的特征向量;
分类模块,用于将所述文本、公式和图片各自对应的特征向量进行拼接,得到融合特征向量,并将所述融合特征向量输入预先训练好的神经网络分类器,所述神经网络分类器输出题目分类标签。
7.根据权利要求6所述的装置,其特征在于,所述装置还包括:
解析模块,用于基于语法编译器,将所述题目数据中公式解析成语法树;
相应的,所述编码模块包括公式编码单元,该公式编码单元用于:
通过树形多层反馈神经网络对输入的所述语法树进行特征提取,将所述语法树编码成公式特征向量;或
根据预设的教研规则在语法树上抽取多个预先定义的特征,并对所述多个预先定义的特征进行独热编码。
8.根据权利要求7所述的装置,其特征在于,所述解析模块包括:
提取转换单元,用于从所述题目数据中提取公式,并将其转换成预设格式的公式;
解析单元,用于基于语法编译器,将转换后的预设格式的公式解析成语法树。
9.一种电子设备,其特征在于,所述电子设备包括:
一个或多个处理器;
存储装置,用于存储一个或多个程序,
当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现如权利要求1-5中任一所述的题目分类方法。
10.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,该程序被处理器执行时实现如权利要求1-5中任一所述的题目分类方法。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海仁静信息技术有限公司,未经上海仁静信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811583166.5/1.html,转载请声明来源钻瓜专利网。