[发明专利]对话标注数据的生成方法及装置在审
申请号: | 202210917683.1 | 申请日: | 2022-08-01 |
公开(公告)号: | CN115345178A | 公开(公告)日: | 2022-11-15 |
发明(设计)人: | 周志衡;徐鹏;征荆;苏毅;沈中南 | 申请(专利权)人: | 支付宝(杭州)信息技术有限公司 |
主分类号: | G06F40/35 | 分类号: | G06F40/35;G06F16/332 |
代理公司: | 北京亿腾知识产权代理事务所(普通合伙) 11309 | 代理人: | 陈霁;周良玉 |
地址: | 310000 浙江省杭州市*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 对话 标注 数据 生成 方法 装置 | ||
本说明书实施例提供一种对话标注数据的生成方法及装置。其中方法包括:获取目标场景下预先生成的形式文法,其中至少包括第一语句和第二语句,第一语句包括第一意图下的第一意图操作和第一变量,所述第一变量是需调用其他语句的变量;第二语句用于为所述第一变量赋值,并包括属性获取操作和第二意图下的第二变量;通过至少调用形式文法中的第一语句和第二语句,生成用于模拟某次人机对话的目标语义表达式,其以嵌套语句形式示出,将第二变量的对应于所述第一变量的属性值,赋值给所述第一变量并进行第一意图操作;基于目标语义表达式,生成对话标注数据,其中包括与构成某次人机对话的若干轮对话对应的若干个用户会话‑语义表达式标签组。
技术领域
本说明书一个或多个实施例涉及计算机技术领域,尤其涉及一种对话标注数据的生成方法及装置。
背景技术
随着人工智能(Artificial Intelligence,简称AI)技术的不断发展,越来越多的行业利用人机对话交互系统,如智能助理、智能客服、自动贩售等,为用户提供信息或服务,例如,提供天气信息、票务信息或订票服务等。
通常,人机对话交互系统通过对话交互界面对用户输入进行一问一答式的响应。为与用户进行交互,系统需要先识别每一轮中用户输入语句对应的意图信息,再确定系统在该轮次的答复内容。为提升人机交互的有效性,进而提高用户体验,需要精准识别意图信息。
目前,训练用于识别用户意图信息的机器学习模型,已成为研究热点。机器学习模型能够实现的功能和能够达到的效果,强依赖于对话标注数据的结构、数量和质量。然而,目前取得对话标注数据的方式有限。
因此,需要一种方案,可以自动生成能够满足更高应用需求的对话标注数据,用于训练功能性更强的机器学习模型,支持与用户进行更为复杂的人机交互,从而有效提高用户体验。
发明内容
本说明书一个或多个实施例描述了一种对话标注数据的生成方法,能够生成支持意图嵌套的对话标注数据,利用此对话标注数据训练出的语义解析模型,能够同时识别出用户会话中的多个意图。
根据第一方面,提供一种对话标注数据的生成方法,包括:获取目标场景下预先生成的形式文法,其中至少包括第一语句和第二语句,第一语句包括第一意图下的第一意图操作和第一变量,所述第一变量是需调用其他语句的变量;第二语句用于为所述第一变量赋值,并包括属性获取操作和第二意图下的第二变量;通过至少调用所述形式文法中的所述第一语句和第二语句,生成所述目标场景下用于模拟某次人机对话的目标语义表达式;所述目标语义表达式以嵌套语句形式示出,将第二变量的对应于所述第一变量的属性值,赋值给所述第一变量并进行所述第一意图操作;基于所述目标语义表达式,生成对话标注数据,其中包括与构成所述某次人机对话的若干轮对话对应的若干个会话-标签组,单个会话-标签组包括一轮对话中的用户会话及其对应的语义表达式标签。
在一个实施例中,获取目标场景下预先生成的形式文法,包括:获取场景信息,其中包括所述目标场景涉及的若干领域,各个领域下的若干用户意图,以及各个用户意图下的若干槽位;获取词典信息,其中包括各个槽位所对应的词典,该词典中包括对应槽位的备选槽值;基于所述场景信息、词典信息和预先定义的语句模板,生成所述形式文法。
在一个实施例中,所述第一意图和第二意图属于同一领域或不同领域。
在一个实施例中,所述形式文法中包括含有起始符号的起始语句;其中,通过至少调用所述形式文法中的所述第一语句和第二语句,生成所述目标场景下用于模拟某次人机对话的目标语义表达式,包括:将所述起始语句作为当前语义表达式,通过逐个调用所述形式文法中其他的多个语句更新所述当前语义表达式,直到当前语义表达式无法进行语句调用,从而将所述当前语义表达式作为所述目标语义表达式;所述多个语句包括所述第一语句和第二语句。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于支付宝(杭州)信息技术有限公司,未经支付宝(杭州)信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210917683.1/2.html,转载请声明来源钻瓜专利网。
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置