[发明专利]一种模型训练和业务处理的方法、装置、存储介质及设备有效
| 申请号: | 202211509841.6 | 申请日: | 2022-11-29 |
| 公开(公告)号: | CN115545002B | 公开(公告)日: | 2023-03-31 |
| 发明(设计)人: | 王维强;林金镇;应缜哲;薛兰青 | 申请(专利权)人: | 支付宝(杭州)信息技术有限公司 |
| 主分类号: | G06F40/194 | 分类号: | G06F40/194;G06F40/289;G06F40/30 |
| 代理公司: | 北京博思佳知识产权代理有限公司 11415 | 代理人: | 李威 |
| 地址: | 310000 浙江省杭州市*** | 国省代码: | 浙江;33 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 模型 训练 业务 处理 方法 装置 存储 介质 设备 | ||
本说明书公开了一种模型训练和业务处理的方法、装置、存储介质及设备。该模型训练的方法包括,获取历史对话,从历史对话中确定目标语句,将历史对话输入待训练的特征提取模型中,以使特征提取模型根据历史对话中除目标语句外的其他语句,确定目标语句对应的语句特征,作为第一特征,以及,根据目标语句,确定目标语句对应的语句特征,作为第二特征,以最小化第一特征与第二特征之间的偏差为优化目标,对特征提取模型进行训练,其中,训练后的特征提取模型用于确定输入的每个对话语句对应的语句特征,并将输出的语句特征进行发送,以使接收端根据接收到的语句特征进行业务处理。
技术领域
本说明书涉及计算机技术领域,尤其涉及一种模型训练和业务处理的方法、装置、存储介质及设备。
背景技术
在诸如隐私保护、风险控制、智能对话等业务场景下,通常需要对用户的对话语句进行分析,从而根据分析结果来执行相应的业务处理。这就需要通过相应的模型算法,来对用户的对话语句进行特征提取,以根据提取到的特征执行相应的业务处理。而提取到的特征质量往往会影响到最终的业务处理结果。
然而,目前采用的特征提取方法所得到的特征质量较差,并不能准确的对整个语句的语意信息进行表达,这就会导致通过这些质量较差的特征进行相应的业务处理时,无法得到准确的业务处理结果。
发明内容
本说明书提供一种模型训练和业务处理的方法、装置、存储介质及设备。以使训练完成后的模型提取到的特征能够准确的表达出对话语句的语意信息,从而得到准确的业务处理结果。
本说明书提供了一种模型训练的方法,包括:
获取历史对话;
从所述历史对话中确定目标语句;
将所述历史对话输入待训练的特征提取模型中,以使所述特征提取模型根据所述历史对话中除所述目标语句外的其他语句,确定所述目标语句对应的语句特征,作为第一特征,以及,根据所述目标语句,确定所述目标语句对应的语句特征,作为第二特征;
以最小化所述第一特征与所述第二特征之间的偏差为优化目标,对所述特征提取模型进行训练,其中,训练后的所述特征提取模型用于确定输入的每个对话语句对应的语句特征,并将输出的语句特征进行发送,以使接收端根据接收到的语句特征进行业务处理。
可选地,将所述历史对话输入所述特征提取模型之前,所述方法还包括:
将所述历史对话中的目标语句替换为指定字符,得到替换后对话;
将所述历史对话输入待训练的特征提取模型中,以使所述特征提取模型根据所述历史对话中除所述目标语句外的其他语句,确定所述目标语句对应的语句特征,作为第一特征,具体包括:
将所述替换后对话输入所述特征提取模型中,以使所述特征提取模型根据所述替换后对话中所述指定字符对应位置以外的其他语句,确定所述指定字符对应位置处的语句特征,作为所述第一特征。
可选地,从所述历史对话中确定目标语句,具体包括:
根据所述历史对话中包含的每个语句对应的被选取的概率,在所述历史对话中选取出所述目标语句。
可选地,从所述历史对话中确定目标语句,具体包括:
若确定需要从所述历史对话中确定出至少两个目标语句,则从在语序上互不相邻的各语句中确定所述目标语句。
可选地,以最小化所述第一特征与所述第二特征之间的偏差为优化目标,对所述特征提取模型进行训练,具体包括:
确定所述第一特征与所述第二特征之间的相似度;
以最大化所述相似度为优化目标,对所述特征提取模型进行训练。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于支付宝(杭州)信息技术有限公司,未经支付宝(杭州)信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202211509841.6/2.html,转载请声明来源钻瓜专利网。





