[发明专利]智能应答系统、启动方法、装置及存储介质在审
申请号: | 202110921158.2 | 申请日: | 2021-08-11 |
公开(公告)号: | CN113779212A | 公开(公告)日: | 2021-12-10 |
发明(设计)人: | 马浩;刘丹 | 申请(专利权)人: | 京东科技信息技术有限公司 |
主分类号: | G06F16/332 | 分类号: | G06F16/332;G06F16/335;G06F16/36;G06F40/279 |
代理公司: | 北京华夏泰和知识产权代理有限公司 11662 | 代理人: | 孙剑锋 |
地址: | 100176 北京市大兴区经济*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 智能 应答 系统 启动 方法 装置 存储 介质 | ||
本发明提供一种智能应答系统、启动方法、装置及存储介质,用以自动生成意图类别对应的正则表达式和相似语料,从而提高智能应答系统冷启动的效率。该智能应答系统的启动方法包括:对于所述智能应答系统中预定义的每一种意图类别,执行如下操作:获取所述意图类别的标准问题信息和所述标准问题信息中的关键词;采用分词算法,将所述标准问题信息按词性进行分词,并以词为单元进行同义词替换,得到替换后语料集;基于所述替换后语料集生成所述意图类别对应的相似语料,以及基于所述替换后语料集和所述标准问题信息中的关键词生成所述意图类别对应的正则表达式。
技术领域
本发明涉及数据分类技术领域,尤其涉及一种智能应答系统、启动方法、装置及存储介质。
背景技术
智能应答系统通常包括自然语言理解系统(Natural Language Understanding,NLU)和对话管理系统(DM),NLU系统的主要功能是将用户意图进行识别归类,DM系统的主要功能是基于NLU系统的识别结果,确定应答内容并推送。
在智能应答系统上线后,并拥有大量的标注数据时,就可以通过训练自然语言理解模型作为NLU系统,以用来识别用户的意图类别,但在智能应答系统的冷启动阶段,由于拥有的标注数据数量有限,还无法训练精确的自然语言理解模型。
因此,在智能应答系统的冷启动阶段,目前是运营按照业务需求在业务预定义的意图分类体系中,为每个意图类别配置正则表达式和相似语料,通过正则表达式匹配和/或相似语料匹配,来实现用户意图分类,如下表一所示。
表一
然而,运营配置正则表达式存在技术门槛,需要学习正则语法才能配置,对于每个意图类别通常需要梳理上千条相似语料,相似语料梳理缓慢,因此,现有的正则表达式和相似语料的配置难度和费力度高,导致智能应答系统冷启动的效率低。
发明内容
有鉴于此,本发明提供一种智能应答系统、启动方法、装置及存储介质,用以自动生成意图类别对应的正则表达式和相似语料,从而提高智能应答系统冷启动的效率。
具体地,本发明是通过如下技术方案实现的:
根据本发明的第一方面,提供一种智能应答系统的启动方法,所述方法包括:
对于所述智能应答系统中预定义的每一种意图类别,执行如下操作:
获取所述意图类别的标准问题信息和所述标准问题信息中的关键词;
采用分词算法,将所述标准问题信息按词性进行分词,并以词为单元进行同义词替换,得到替换后语料集;
基于所述替换后语料集生成所述意图类别对应的相似语料,以及基于所述替换后语料集和所述标准问题信息中的关键词生成所述意图类别对应的正则表达式。
在一些实施例中,所述以词为单元进行同义词替换,得到替换后语料集,包括:
以词为单元进行同义词替换,并做笛卡儿积的交叉组合,得到替换后语料集。
在一些实施例中,所述基于所述替换后语料集生成所述意图类别对应的相似语料,包括:
基于所述替换后语料集生成备选语料集;
对于所述备选语料集中的每一备选语料,调用已有的相似匹配模型将所述备选语料与所述标准问题信息进行相似度匹配;
若两者的相似度高于设定的相似阈值,则将所述备选语料作为所述意图类别对应的相似语料,并存储到第一预设数据库中。
在一些实施例中,所述基于所述替换后语料集生成备选语料集,包括:
将所述替换后语料集作为备选语料集;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于京东科技信息技术有限公司,未经京东科技信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110921158.2/2.html,转载请声明来源钻瓜专利网。