[发明专利]一种冷启动的槽填充方法、系统、装置及存储介质有效
申请号: | 202011236739.4 | 申请日: | 2020-11-09 |
公开(公告)号: | CN112380327B | 公开(公告)日: | 2022-03-04 |
发明(设计)人: | 徐蕾;吴三阳;袁征 | 申请(专利权)人: | 天翼爱音乐文化科技有限公司 |
主分类号: | G06F16/332 | 分类号: | G06F16/332;G06F16/33;G06F40/211;G06F40/242;G06F40/284;G06F40/35 |
代理公司: | 广州嘉权专利商标事务所有限公司 44205 | 代理人: | 常柯阳 |
地址: | 510055 广东省*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 冷启动 填充 方法 系统 装置 存储 介质 | ||
本发明的提供了一种冷启动的槽填充方法、系统、装置及介质,方法包括:获取对话文本,确定对话文本的词典和语义规则;根据词典以及语义规则生成标注语句,根据标注语句训练第一槽填充模型;通过训练完成后的第一槽填充模型进行语义槽提取,得到第一语义槽集合;根据标注语句以及第一语义槽集合,通过第一槽填充模型生成第二槽填充模型;根据训练完成后的第二槽填充模型进行语义槽提取,得到第二语义槽集合,根据第二语义槽提取对话文本中的信息,方法能够达到较好的泛化能力;使得在冷启动阶段就能达到较高的槽填充准确率,同时使得对话系统能够处理规则以外的各种句式,提升了槽填充的鲁棒性,可广泛应用于计算机技术领域。
技术领域
本发明属于计算机技术领域,尤其是一种冷启动的槽填充方法、系统、装置及存储介质。
背景技术
人机对话系统是指能和人一样与用户进行多轮自然语言交互的机器系统。人机对话系统主要可以分为两大类,一类是聊天型人机对话系统,另一类是面向特定任务的任务型人机对话系统。任务型人机对话系统旨在帮助用户完成特定信息服务任务,例如,机器客服帮助人们进行机票预订、搜索音乐等,机器客服能够二十四小时在线为用户提供服务,节省用户的等待时间,并节省大量的人力成本,因此任务型人机对话系统具有广泛的应用价值。
在任务型人机对话系统中,首要的任务便是对话理解,其系统的主要工作是对用户的对话进行分析,获取对话行为和任务相关的关键信息。为了从用户的对话中抽取出任务相关的关键信息,需要采用槽填充方法标识出句子中与任务相关的语义槽,例如在音乐搜索任务中,歌曲名、歌手名、专辑名等就是与任务相关的语义槽,只要从语句中获取了所需要的槽的具体值,就能用于完成具体的任务。
在实际生产环境中,基于规则的方法在槽填充任务中得到了较多使用。通过观察语料中的文本数据,基于语言学知识,人工为每个槽构造一些识别模板组成模板集合,这些模板可以是基于字、词、词性或者句法的。得到槽的模板集合后,再设置模板使用的顺序,对用户输入的句子逐一按顺序使用模板来抽取槽信息。槽和槽值是对话系统下游状态管理、信息检索、对话生成的关键输入信息。但基于规则的方法也存在一些缺点,其在于构建规则模板需要大量的人力成本,同时构建出的规则模板集使用范围有限,难以覆盖到所有情况。通过深度神经网络模型进行序列标注来完成槽填充任务可以很好地弥补规则方法所带来的缺陷,在不需要耗费大量人力构建领域规则的情况下,训练好一个槽填充模型,便能针对各式各样的句式进行槽填充工作。但在实际生产环境中,在构建任务型对话系统的冷启动阶段,往往缺少可以用来训练深度模型的训练语料,因此难以获得有效的槽填充序列标注模型;使用规则方法可以在冷启动阶段用于槽填充任务,但是由于规则的局限性使得冷启动阶段的槽填充效果无法达到理想的目标。
发明内容
有鉴于此,为部分解决上述技术问题之一,本发明实施例目的在于提供一种覆盖率高、可离线运行的一种冷启动的槽填充方法;同时,本发明的实施例还提供可以可对应执行该槽填充方法的系统、装置以及计算机可读的存储介质。
第一方面,本发明实施例提供了一种冷启动的槽填充方法,其包括以下步骤:
获取对话文本,确定对话文本的词典和语义规则;
根据词典以及语义规则生成标注语句,根据标注语句训练第一槽填充模型;
通过训练完成后的第一槽填充模型进行语义槽提取,得到第一语义槽集合;
根据标注语句以及第一语义槽集合训练第一槽填充模型,得到第二槽填充模型;
根据训练完成后的第二槽模型进行语义槽提取,得到第二语义槽集合,根据第二语义槽提取对话文本中的信息。
可以理解的是,在上述实施例中,冷启动的槽填充方法还可以包括以下步骤:
根据语义规则进行匹配,得到匹配词汇;根据词典确定匹配词汇的语义槽,得到第二语义槽集合。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于天翼爱音乐文化科技有限公司,未经天翼爱音乐文化科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011236739.4/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种雾霾净化过滤器
- 下一篇:一种环保型枝条裁剪机