[发明专利]一种训练标记预测模型的方法及系统有效
申请号: | 202010078148.2 | 申请日: | 2020-01-23 |
公开(公告)号: | CN111274377B | 公开(公告)日: | 2023-06-02 |
发明(设计)人: | 方军鹏 | 申请(专利权)人: | 支付宝(杭州)信息技术有限公司 |
主分类号: | G06F16/332 | 分类号: | G06F16/332;G06F16/35;G06F18/241;G06Q30/01;G06N20/00 |
代理公司: | 成都七星天知识产权代理有限公司 51253 | 代理人: | 杨永梅 |
地址: | 310000 浙江省杭州市*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 训练 标记 预测 模型 方法 系统 | ||
本说明书实施例公开了一种训练标记预测模型的方法及系统,所述方法包括:获取多个样本,所述多个样本合计包含M个不同标记,M为≥1的整数;分别除去所述多个样本中每个样本的噪声标记,得到所述多个样本的优化样本集;分别从同一个所述样本的真实标记集和无关标记集中任选一个标记,生成至少一个标记对(x,y);从所述优化样本集中选取训练二分类器的正负样本,训练得到的目标二分类器用于预测所述标记对(x,y)的第一标记x和第二标记y;将P个所述目标二分类器组成标记预测模型,P为生成的不同的所述标记对的个数。
技术领域
本说明书实施例涉及计算机技术领域,特别涉及一种训练标记预测模型的方法及系统。
背景技术
随着互联网的快速发展,智能客服机器人在各个领域的线上平台上起到了举足轻重的作用。通常,用户输入某个内容以后,智能客服机器人可以通过机器学习方法猜测用户的问题,并对问题进行解答,提高用户体验。若针对用户输入的问题只给出一个回答或者一个问题时,机器学习只需学习数据的一个标记即可。
然而,大多数情况下用户遇到的问题不止一个,智能客服机器人需要基于用户输入的内容猜测多个疑问或/和答案。例如,某购物平台,用户输入“开通会员”,用户的疑问可能是“开通会员的条件”、“开通会员的流程”或/和“开通会员后的优惠”等。因此,亟需一种对数据(例如,用户输入的内容)进行多标记学习的方法。
发明内容
本说明书实施例的一个方面提供一种训练标记预测模型的方法,包括:获取多个样本,所述多个样本合计包含M个不同标记,M为≥1的整数;分别除去所述多个样本中每个样本的噪声标记,得到所述多个样本的优化样本集;分别从同一个所述样本的真实标记集和无关标记集中任选一个标记,生成至少一个标记对(x,y);所述真实标记集由所述至少一个候选标记中除所述噪声标记以外的标记组成;所述无关标记集由所述M个标记中除所述候选标记以外的标记组成;从所述优化样本集中选取训练二分类器的正负样本,训练得到的目标二分类器用于预测所述标记对(x,y)的第一标记x和第二标记y;将P个所述目标二分类器组成标记预测模型,P为生成的不同的所述标记对的个数。
本说明书实施例的一个方面提供一种训练标记预测模型的系统,包括:样本获取模块,用于所述多个样本合计包含M个不同标记,M为≥1的整数;标记去噪模块,用于分别除去所述多个样本中每个样本的噪声标记,得到所述多个样本的优化样本集;标记对生成模块,用于分别从同一个所述样本的真实标记集和无关标记集中任选一个标记,生成至少一个标记对(x,y);所述真实标记集由所述至少一个候选标记中除所述噪声标记以外的标记组成;所述无关标记集由所述M个标记中除所述候选标记以外的标记组成;样本选取模块,用于从所述优化样本集中选取训练二分类器的正负样本,训练得到的目标二分类器用于预测所述标记对(x,y)的第一标记x和第二标记y;标记预测模型生成模块,用于将P个所述目标二分类器组成标记预测模型,P为生成的不同的所述标记对的个数。
本说明书实施例的一个方面提供一种训练标记预测模型的装置,包括至少一个存储介质和至少一个处理器,所述至少一个存储介质用于存储计算机指令;所述至少一个处理器用于执行所述计算机指令以实现如上任一项所述的方法。
本说明书实施例的一个方面提供一种计算机可读存储介质,所述存储介质存储计算机指令,当计算机读取存储介质中的计算机指令后,计算机运行如上所述的任一项所述的方法。
附图说明
本说明书将以示例性实施例的方式进一步描述,这些示例性实施例将通过附图进行详细描述。这些实施例并非限制性的,在这些实施例中,相同的编号表示相同的结构,其中:
图1是根据本说明书的一些实施例所示的示例性训练标记预测模型系统的应用场景示意图;
图2是根据本说明书的一些实施例所示的示例性训练标记预测模型系统的模块图;
图3是根据本说明书的一些实施例所示的训练标记预测模型方法的示例性流程图;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于支付宝(杭州)信息技术有限公司,未经支付宝(杭州)信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010078148.2/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种用于LED电子屏散热装置
- 下一篇:极片纠偏装置及锂电池卷绕设备