[发明专利]一种用户意图的语料扩展方法和系统有效
申请号: | 202010440488.5 | 申请日: | 2020-05-22 |
公开(公告)号: | CN111339309B | 公开(公告)日: | 2020-09-04 |
发明(设计)人: | 金春祥;刘佳;崔恒斌 | 申请(专利权)人: | 支付宝(杭州)信息技术有限公司 |
主分类号: | G06F16/35 | 分类号: | G06F16/35;G06F16/33;G06F16/332 |
代理公司: | 成都七星天知识产权代理有限公司 51253 | 代理人: | 杨永梅 |
地址: | 310000 浙江省杭州市*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 用户 意图 语料 扩展 方法 系统 | ||
本说明书的实施例公开了一种用户意图的语料扩展方法,该方法包括:获取第一服务话术和用户意图,所述用户意图为回答所述第一服务话术的话语所代表的意图;从至少一条第二服务话术中,确定与所述第一服务话术的相似度满足第一预设条件的至少一条第三服务话术,所述第二服务话术为对话记录中的服务话术;确定至少一条候选扩展语料,所述候选扩展语料为所述对话记录中回答所述至少一条第三服务话术的话语;从所述至少一条候选扩展语料中,确定至少一条目标扩展语料,所述目标扩展语料的意图与所述用户意图相同或者相近;将所述至少一条目标扩展语料作为所述用户意图的扩展语料。
技术领域
本申请涉及数据处理领域,特别涉及一种用户意图的语料扩展方法和系统。
背景技术
随着人工智能的发展,机器可以通过对人类语言进行分析,识别语句的含义,实现人机交互。问答为人机交互的一种典型应用场景,机器需要识别出提用户说的话的意图,才能准确的给出后续的对话。
用户意图可以通过建立自然语言模型来预测。然而,模型的建立需要大量的训练语料,在训练模型的语料数量有限的情况下,需要挖掘更多的用户语料,做数据增强,提升模型对用户意图的识别效果。因此,亟需一种用户意图的语料扩展方法和系统。
发明内容
本说明书一个方面提供一种用户意图的语料扩展方法,所述方法包括:获取第一服务话术和用户意图,所述用户意图为回答所述第一服务话术的话语所代表的意图;从至少一条第二服务话术中,确定与所述第一服务话术的相似度满足第一预设条件的至少一条第三服务话术,所述第二服务话术为对话记录中的服务话术;确定至少一条候选扩展语料,所述候选扩展语料为所述对话记录中回答所述至少一条第三服务话术的话语;从所述至少一条候选扩展语料中,确定至少一条目标扩展语料,所述目标扩展语料的意图与所述用户意图相同或者相近;将所述至少一条目标扩展语料作为所述用户意图的扩展语料。
本说明书另一个方面提供一种用户意图的语料扩展系统,所述系统包括:第一获取模块,用于获取第一服务话术和用户意图,所述用户意图为回答所述第一服务话术的话语所代表的意图;第一确定模块,用于从至少一条第二服务话术中,确定与所述第一服务话术的相似度满足第一预设条件的至少一条第三服务话术,所述第二服务话术为对话记录中的服务话术;第二确定模块,用于确定至少一条候选扩展语料,所述候选扩展语料为所述对话记录中回答所述至少一条第三服务话术的话语;第三确定模块,用于从所述至少一条候选扩展语料中,确定至少一条目标扩展语料,所述目标扩展语料的意图与所述用户意图相同或者相近;将所述至少一条目标扩展语料作为所述用户意图的扩展语料。
本说明书另一个方面提供一种用户意图的语料扩展装置,包括至少一个存储介质和至少一个处理器;所述至少一个存储介质用于存储计算机指令;所述至少一个处理器用于执行所述计算机指令以实现用户意图的语料扩展方法。
附图说明
本说明书将以示例性实施例的方式进一步说明,这些示例性实施例将通过附图进行详细描述。这些实施例并非限制性的,在这些实施例中,相同的编号表示相同的结构,其中:
图1是根据本说明书一些实施例所示的用户意图的语料扩展系统的示例性应用场景示意图;
图2是根据本说明书一些实施例所示的用户意图的语料扩展方法的示例性示意图;
图3是根据本说明书一些实施例所示的确定第三服务话术方法的示例性示意图;
图4是根据本说明书一些实施例所示的确定目标扩展语料的示例性示意图。
具体实施方式
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于支付宝(杭州)信息技术有限公司,未经支付宝(杭州)信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010440488.5/2.html,转载请声明来源钻瓜专利网。