[发明专利]数学问题求解模型的训练方法和装置、推理方法和装置有效
申请号: | 201510363088.8 | 申请日: | 2015-06-26 |
公开(公告)号: | CN104933158B | 公开(公告)日: | 2018-06-19 |
发明(设计)人: | 周力普;戴帅湘;周晓 | 申请(专利权)人: | 百度在线网络技术(北京)有限公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 北京品源专利代理有限公司 11332 | 代理人: | 孟金喆;胡彬 |
地址: | 100085 北京市*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 方法和装置 求解模型 数学问题 推理 训练文本 规约 二次规划问题 权重向量 搜索空间 特征向量 错误解 模板库 运算量 最大化 求解 | ||
本发明实施例公开了一种数学问题求解模型的训练方法和装置、推理方法和装置。所述训练方法包括:确定针对训练文本的简化的公式模板库;提取所述训练文本的特征向量;以及通过求解由最大化正确解与错误解之间的边际而规约得到的二次规划问题,确定所述数学问题求解模型的权重向量。本发明实施例提供的数学问题求解模型的训练方法和装置、推理方法和装置缩小了模型的搜索空间,降低了运算量。
技术领域
本发明实施例涉及自然语言处理技术领域,尤其涉及一种数学问题求解模型的训练方法和装置、推理方法和装置。
背景技术
对自然语言描述的数学问题的自动求解是教育产业的应用热点。目前,在这个方向上已经陆续有成型的产品推出。但是,已经推出的产品普遍存在着对文本的理解能力不强,应用效果不好的缺陷。
Kushman等人针对现有技术的上述缺陷,提出了一种专门用于理解数学问题的描述文本,并求取数学问题的解的模型。参见图1,通过对输入文本的理解,可以将输入文本描述的数学问题对应至一个公式模板,然后,通过将所述输入文本中已知量、未知量以及名词对齐至所述公式模板中的各个槽位(slot),可以将公式模板实例化为一个具体的公式。然后,通过对公式的求解就可以得到所述数学问题的解。
如果将上述选取模板、实例化及求解的全过程称为一次推导,则可以定义一次推导y相对于问题x的条件概率是:
其中,φ(x,y)表示问题x与推导y之间的特征函数,θ表示权重参数。
将式(1)取对数,并对不同的推导y进行求和,即得到最大似然估计的目标函数:
假定对于问题x的特征向量是确定的,那么,运用最大似然估计的理念,使得上述式(2)的取值为最大的权重向量θ对应的模型即是求解文本描述的数学问题的最优的模型。
这种方案虽然提供了文本描述的数学问题的一种理论上可行的方法。但是,求解上述模型的时候,备选求解公式模板及对齐方式的数目太多,造成需要搜索的搜索空间太大,算法复杂度太高。并且,这种解决方案还存在着局部收敛的问题。
发明内容
针对上述技术问题,本发明实施例提供了一种数学问题自动求解模型的训练方法和装置、推理方法和装置,以缩小搜索空间,降低运算量。
第一方面,本发明实施例提供了一种数学问题求解模型的训练方法,所述方法包括:
确定针对训练文本的简化的公式模板库,所述公式模板库包含用于解决所述数学问题的公式模板;
提取所述训练文本的特征向量;
通过求解由最大化正确解与错误解之间的边际而规约得到的二次规划问题,确定所述数学问题求解模型的权重向量。
第二方面,本发明实施例提供了一种数学问题求解模型的训练装置,所述装置包括:
模板库确定模块,用于确定针对训练文本的简化的公式模板库,所述公式模板库包含用于解决所述数学问题的公式模板;
特征向量提取模块,用于提取所述训练文本的特征向量;
模型确定模块,用于通过求解由最大化正确解与错误解之间的边际而规约得到的二次规划问题,确定所述数学问题求解模型的权重向量。
第三方面,本发明实施例提供了一种数学问题求解模型的推理方法,所述方法包括:
利用所述数学问题求解模型提取用于描述数学问题的输入文本的特征向量,其中,所述数学问题求解模型是根据用于解决数学问题的简化的公式模板,并根据二次规划方法构建的求解模型;
利用所述数学问题求解模型,根据所述特征向量获取所述数学问题的最优解。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于百度在线网络技术(北京)有限公司,未经百度在线网络技术(北京)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201510363088.8/2.html,转载请声明来源钻瓜专利网。