[发明专利]对话标注数据的生成方法及装置在审

专利信息
申请号: 202210917683.1 申请日: 2022-08-01
公开(公告)号: CN115345178A 公开(公告)日: 2022-11-15
发明(设计)人: 周志衡;徐鹏;征荆;苏毅;沈中南 申请(专利权)人: 支付宝(杭州)信息技术有限公司
主分类号: G06F40/35 分类号: G06F40/35;G06F16/332
代理公司: 北京亿腾知识产权代理事务所(普通合伙) 11309 代理人: 陈霁;周良玉
地址: 310000 浙江省杭州市*** 国省代码: 浙江;33
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 对话 标注 数据 生成 方法 装置
【说明书】:

本说明书实施例提供一种对话标注数据的生成方法及装置。其中方法包括:获取目标场景下预先生成的形式文法,其中至少包括第一语句和第二语句,第一语句包括第一意图下的第一意图操作和第一变量,所述第一变量是需调用其他语句的变量;第二语句用于为所述第一变量赋值,并包括属性获取操作和第二意图下的第二变量;通过至少调用形式文法中的第一语句和第二语句,生成用于模拟某次人机对话的目标语义表达式,其以嵌套语句形式示出,将第二变量的对应于所述第一变量的属性值,赋值给所述第一变量并进行第一意图操作;基于目标语义表达式,生成对话标注数据,其中包括与构成某次人机对话的若干轮对话对应的若干个用户会话‑语义表达式标签组。

技术领域

本说明书一个或多个实施例涉及计算机技术领域,尤其涉及一种对话标注数据的生成方法及装置。

背景技术

随着人工智能(Artificial Intelligence,简称AI)技术的不断发展,越来越多的行业利用人机对话交互系统,如智能助理、智能客服、自动贩售等,为用户提供信息或服务,例如,提供天气信息、票务信息或订票服务等。

通常,人机对话交互系统通过对话交互界面对用户输入进行一问一答式的响应。为与用户进行交互,系统需要先识别每一轮中用户输入语句对应的意图信息,再确定系统在该轮次的答复内容。为提升人机交互的有效性,进而提高用户体验,需要精准识别意图信息。

目前,训练用于识别用户意图信息的机器学习模型,已成为研究热点。机器学习模型能够实现的功能和能够达到的效果,强依赖于对话标注数据的结构、数量和质量。然而,目前取得对话标注数据的方式有限。

因此,需要一种方案,可以自动生成能够满足更高应用需求的对话标注数据,用于训练功能性更强的机器学习模型,支持与用户进行更为复杂的人机交互,从而有效提高用户体验。

发明内容

本说明书一个或多个实施例描述了一种对话标注数据的生成方法,能够生成支持意图嵌套的对话标注数据,利用此对话标注数据训练出的语义解析模型,能够同时识别出用户会话中的多个意图。

根据第一方面,提供一种对话标注数据的生成方法,包括:获取目标场景下预先生成的形式文法,其中至少包括第一语句和第二语句,第一语句包括第一意图下的第一意图操作和第一变量,所述第一变量是需调用其他语句的变量;第二语句用于为所述第一变量赋值,并包括属性获取操作和第二意图下的第二变量;通过至少调用所述形式文法中的所述第一语句和第二语句,生成所述目标场景下用于模拟某次人机对话的目标语义表达式;所述目标语义表达式以嵌套语句形式示出,将第二变量的对应于所述第一变量的属性值,赋值给所述第一变量并进行所述第一意图操作;基于所述目标语义表达式,生成对话标注数据,其中包括与构成所述某次人机对话的若干轮对话对应的若干个会话-标签组,单个会话-标签组包括一轮对话中的用户会话及其对应的语义表达式标签。

在一个实施例中,获取目标场景下预先生成的形式文法,包括:获取场景信息,其中包括所述目标场景涉及的若干领域,各个领域下的若干用户意图,以及各个用户意图下的若干槽位;获取词典信息,其中包括各个槽位所对应的词典,该词典中包括对应槽位的备选槽值;基于所述场景信息、词典信息和预先定义的语句模板,生成所述形式文法。

在一个实施例中,所述第一意图和第二意图属于同一领域或不同领域。

在一个实施例中,所述形式文法中包括含有起始符号的起始语句;其中,通过至少调用所述形式文法中的所述第一语句和第二语句,生成所述目标场景下用于模拟某次人机对话的目标语义表达式,包括:将所述起始语句作为当前语义表达式,通过逐个调用所述形式文法中其他的多个语句更新所述当前语义表达式,直到当前语义表达式无法进行语句调用,从而将所述当前语义表达式作为所述目标语义表达式;所述多个语句包括所述第一语句和第二语句。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于支付宝(杭州)信息技术有限公司,未经支付宝(杭州)信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202210917683.1/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top