[发明专利]机器学习方法、装置、设备及存储介质在审
申请号: | 201811030112.6 | 申请日: | 2018-09-05 |
公开(公告)号: | CN109256122A | 公开(公告)日: | 2019-01-22 |
发明(设计)人: | 叶俊鹏;徐易楠;刘云峰;吴悦;陈正钦;杨振宇;胡晓;汶林丁 | 申请(专利权)人: | 深圳追一科技有限公司 |
主分类号: | G10L15/22 | 分类号: | G10L15/22;G10L15/06;G10L15/07 |
代理公司: | 北京细软智谷知识产权代理有限责任公司 11471 | 代理人: | 葛钟 |
地址: | 518000 广东省深圳市南山区粤海*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 任务处理 反馈数据 指令 用户请求数据 机器学习 训练数据 存储介质 模型训练 请求数据 数据包括用户 行为习惯 匹配 反馈 申请 | ||
本发明涉及一种机器学习方法、装置、设备及存储介质。其中,机器学习方法包括:获取用户请求数据;获取基于用户请求数据生成的指令;指令经由预先训练的任务处理模型基于作为输入数据的用户请求数据得到;获取用户对指令的执行结果的反馈数据;以用户请求数据、指令和反馈数据作为训练数据,训练任务处理模型。由于本申请提供的方法中,任务处理模型训练用的数据包括用户请求数据、指令和反馈数据作为训练数据,其中,反馈数据是用户对指令的执行结果的反馈的数据,由于任务处理模型训练用的训练数据包括:反馈数据。在对任务处理模型进行训练的过程中,可以使得任务处理模型基于用户的请求数据生成的指令与用户的行为习惯匹配。
技术领域
本发明涉及智能设备技术领域,具体涉及一种机器学习方法、装置、设备及存储介质。
背景技术
随着科技水平的提高,越来越多的智能设备进入人们的生活。其中,机器客服就是一种可以为人们生活带来极大便利的智能设备。机器客服主要用于为用户解答常见的问题,查询资料或完成一些特定的任务。机器客服在用于上述用途时,需要调用后台的任务处理模型以完成与用户的交互。
但是,为了使任务处理模型更加智能,需要向任务处理模型输入预先采集的数据,以进行训练。但是,由于为预先采集的数据包括请求数据和指令,训练数据的来源与用户无关,所以训练后的任务处理模型基于用户的请求数据生成的指令与用户的行为习惯并不匹配。
发明内容
有鉴于此,本发明的目的在于克服训练后的任务处理模型局域用户的请求数据生成的指令与用户的行为习惯并不匹配的问题,提供一种机器学习方法、装置、设备及存储介质。
根据本申请实施例的第一方面,提供一种机器学习方法,包括:
获取用户请求数据;
获取基于所述用户请求数据生成的指令;所述指令经由预先训练的任务处理模型基于作为输入数据的所述用户请求数据得到;
获取用户对所述指令的执行结果的反馈数据;
以所述用户请求数据、所述指令和所述反馈数据作为训练数据,训练所述任务处理模型。
可选的,所述用户请求数据为音频请求数据。
所述任务处理模型包括:词向量模型、语音识别模型、实体识别模型、状态追踪模型、词槽预测模型、指令生成模型:
所述预先训练的任务处理模型基于所述用户请求数据得到所述指令的过程,包括:
通过所述语音识别模型,提取所述音频请求数据的特征,以及将所述音频进行识别,得到用户请求语句;
通过所述词向量模型,转化所述用户请求语句为词向量;
通过所述状态追踪模型,根据当前用户请求语句和所述词向量及历史请求语句及词向量,生成新的对话状态特征,并记录用户请求语句和词向量形成历史请求语句及词向量;其中,所述历史请求语句及词向量为本次用户请求语句之前的历史请求语句及词向量;
通过所述实体识别模型,对所述用户请求问句进行实体识别得到所述用户请求问句对应的实体识别标签;
通过词槽预测模型,根据所述对话状态特征和所述实体识别标签,生成任务词槽,并对任务词槽进行填充,
通过指令生成模型,根据所述对话状态特征和所述已填充任务词槽,生成指令。
可选的,所述词向量模型、所述特征提取模型、所述实体识别模型、所述状态追踪模型、所述词槽预测模型和所述指令生成模型为深度学习模型。
可选的,所述预先训练的任务处理模型基于预先采集的训练用的用户请求数据、训练用的指令和训练用的反馈数据作为训练数据训练得到。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于深圳追一科技有限公司,未经深圳追一科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811030112.6/2.html,转载请声明来源钻瓜专利网。