[发明专利]对话数据处理方法、装置、设备以及存储介质在审
申请号: | 202110491454.3 | 申请日: | 2021-05-06 |
公开(公告)号: | CN113139039A | 公开(公告)日: | 2021-07-20 |
发明(设计)人: | 宋阳;陈蒙 | 申请(专利权)人: | 京东数字科技控股股份有限公司 |
主分类号: | G06F16/33 | 分类号: | G06F16/33;G06F16/332;G06F16/35 |
代理公司: | 北京英赛嘉华知识产权代理有限责任公司 11204 | 代理人: | 王达佐;马晓亚 |
地址: | 100176 北京市大兴区经济*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 对话 数据处理 方法 装置 设备 以及 存储 介质 | ||
1.一种对话数据处理方法,所述方法包括:
获取对话数据,并对所述对话数据进行解析,得到所述对话数据对应的各个问题和各个问题对应的问题答复;
对各个所述问题答复进行分析,得到各个所述问题答复对应的各个分类标识、每个所述分类标识对应的各个问题答复和每个所述分类标识对应的标准答复,其中,所述各个分类标识基于对各个所述问题答复进行分类而得到,所述标准答复基于所述分类标识对应的各个问题答复而确定;
将各个问题作为输入数据,将与输入的各个问题所对应的标准答复作为输出数据,训练得到信息确定模型,其中,所述信息确定模型用于表征基于每个问题对应的所述问题答复、各个所述分类标识对应的各个问题答复和各个所述分类标识,确定输入的每个问题与各个所述标准答复之间的对应结果。
2.根据权利要求1所述的方法,其中,所述对各个所述问题答复进行分析,得到各个所述问题答复对应的各个分类标识、每个所述分类标识对应的各个问题答复和每个所述分类标识对应的标准答复,包括:
将各个所述问题答复进行向量化;
对向量化后的各个所述问题答复进行聚类,得到各个所述问题答复对应的各个分类标识和每个所述分类标识对应的各个问题答复,其中,所述聚类用于表征利用聚类算法将内容相近的各个所述问题答复进行聚合;
对每个所述分类标识对应的各个问题答复进行选取,得到相应所述分类标识对应的标准答复。
3.根据权利要求1所述的方法,其中,所述信息确定模型包括:第一确定子模型和第二确定子模型,所述第一确定子模型用于表征基于每个问题对应的所述问题答复和各个所述分类标识对应的各个问题答复,确定输入的每个问题与各个所述分类标识之间的对应结果,所述第二确定子模型用于表征基于所述第一确定子模型输出每个问题对应的所述分类标识,确定输入的每个问题与各个所述标准答复之间的对应结果;
所述将各个问题作为输入数据,将与输入的各个问题所对应的标准答复作为输出数据,训练得到信息确定模型,包括:
将各个问题作为输入数据,将与输入的各个问题所对应的分类标识作为输出数据,训练得到所述第一确定子模型;
将各个问题作为输入数据,将与输入的各个问题所对应的标准答复作为输出数据,训练得到所述第二确定子模型;
基于训练完成的所述第一确定子模型和训练完成的所述第二确定子模型,确定所述信息确定模型。
4.根据权利要求1所述的方法,在所述对各个所述问题答复进行分析,得到各个所述问题答复对应的各个分类标识、每个所述分类标识对应的各个问题答复和每个所述分类标识对应的标准答复之前,还包括:
对各个所述问题答复进行数据处理,得到处理后的各个所述问题答复,其中,所述数据处理包括:无效数据修正、数据合并、数据去重和数据归一化中的至少一项。
5.一种用于生成信息的方法,所述方法包括:
获取用户发送的问题;
将所述问题输入至预先训练的信息确定模型,生成所述问题对应的标准答复,其中,所述信息确定模型通过如权利要求1-4之一所述的方法训练得到。
6.根据权利要求5所述的方法,其中,所述信息确定模型包括标识确定子模型和答复确定子模型,所述标识确定子模型用于确定所述问题与分类标识之间的对应结果,所述答复确定子模型用于表征基于所述标识确定子模型输出的所述问题的分类标识,确定所述问题与标准答复之间的对应结果;
所述将所述问题输入至预先训练的信息确定模型,生成所述问题对应的标准答复,包括:
将所述问题输入至预先训练的所述标识确定子模型,生成所述问题对应的分类标识;
将生成的所述问题对应的分类标识输入至预先训练的答复确定子模型,生成所述问题对应的标准答复。
7.根据权利要求5所述的方法,还包括:
利用打分方法,对所述问题对应的标准答复进行打分,得到所述问题对应的标准答复的分值;
基于所述问题对应的各个标准答复的分值排序,确定所述问题的最终答复;
将所述最终答复信息发送至所述用户。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于京东数字科技控股股份有限公司,未经京东数字科技控股股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110491454.3/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种病理微环境响应的原位自组装多肽衍生物及其应用
- 下一篇:一种多层级帐篷