[发明专利]数学问题求解模型的训练方法和装置、推理方法和装置有效
申请号: | 201510363088.8 | 申请日: | 2015-06-26 |
公开(公告)号: | CN104933158B | 公开(公告)日: | 2018-06-19 |
发明(设计)人: | 周力普;戴帅湘;周晓 | 申请(专利权)人: | 百度在线网络技术(北京)有限公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 北京品源专利代理有限公司 11332 | 代理人: | 孟金喆;胡彬 |
地址: | 100085 北京市*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 方法和装置 求解模型 数学问题 推理 训练文本 规约 二次规划问题 权重向量 搜索空间 特征向量 错误解 模板库 运算量 最大化 求解 | ||
1.一种数学问题求解模型的训练方法,其特征在于,包括:
确定针对训练文本的简化的公式模板库,所述公式模板库包含用于解决所述数学问题的经过简化的公式模板;其中,所述简化的公式模板为不再考虑所述训练文本中未知量本身的公式模板;
提取所述训练文本的特征向量;
通过求解由最大化正确解与错误解之间的边际而规约得到的二次规划问题,确定所述数学问题求解模型的权重向量。
2.根据权利要求1所述的方法,其特征在于,提取所述训练文本的特征向量包括:
根据数字的上下文特征、所述训练文本中不同数字的上下文之间的相似程度及相关程度,和/或数字与所述训练文本中的问句之间的相关程度确定所述训练文本的特征向量元素。
3.根据权利要求2所述的方法,其特征在于,根据数字的上下文特征确定所述训练文本的特征向量元素包括:
提取所述数字的上下文中的词性标签、词语标签以及依存特征。
4.根据权利要求2所述的方法,其特征在于,根据所述训练文本中不同数字的上下文之间的相似程度确定所述训练文本的特征向量元素包括:
提取不同数字在所述训练文本中的特征参数;
根据不同数字在所述训练文本中的特征参数的相似程度,确定所述训练文本的特征向量元素。
5.根据权利要求4所述的方法,其特征在于,所述特征参数包括:所述数字的上下文中的词语、所述数字的上下文的词性标签以及所述数字的上下文的依存特征。
6.根据权利要求2所述的方法,其特征在于,根据所述训练文本中不同数字的上下文之间的相关程度确定所述训练文本的特征向量元素包括:
获取与所述数字相关联的名词词组;
根据所述名词词组中不同名词的出现次序,确定所述训练文本的特征向量元素。
7.根据权利要求2所述的方法,其特征在于,根据数字与所述训练文本中的问句之间的相关程度确定所述训练文本的特征向量元素包括:
根据与所述数字相关联的名词词组中的名词在问句中的出现次序,确定所述训练文本的特征向量元素。
8.一种数学问题求解模型的训练装置,其特征在于,包括:
模板库确定模块,用于确定针对训练文本的简化的公式模板库,所述公式模板库包含用于解决所述数学问题的经过简化的公式模板;其中,所述简化的公式模板为不再考虑所述训练文本中未知量本身的公式模板;
特征向量提取模块,用于提取所述训练文本的特征向量;
模型确定模块,用于通过求解由最大化正确解与错误解之间的边际而规约得到的二次规划问题,确定所述数学问题求解模型的权重向量。
9.根据权利要求8所述的装置,其特征在于,所述特征向量提取模块具体用于:
根据数字的上下文特征、所述训练文本中不同数字的上下文之间的相似程度及相关程度,和/或数字与所述训练文本中的问句之间的相关程度确定所述训练文本的特征向量元素。
10.根据权利要求9所述的装置,其特征在于,根据数字的上下文特征确定所述训练文本的特征向量元素包括:
提取所述数字的上下文中的词性标签、词语标签以及依存特征。
11.根据权利要求9所述的装置,其特征在于,所述特征向量提取模块根据所述训练文本中不同数字的上下文之间的相似程度确定所述训练文本的特征向量元素包括:
提取不同数字在所述训练文本中的特征参数;
根据不同数字在所述训练文本中的特征参数的相似程度,确定所述训练文本的特征向量元素。
12.根据权利要求11所述的装置,其特征在于,所述特征参数包括:所述数字的上下文中的词语、所述数字的上下文的词性标签以及所述数字的上下文的依存特征。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于百度在线网络技术(北京)有限公司,未经百度在线网络技术(北京)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201510363088.8/1.html,转载请声明来源钻瓜专利网。