[发明专利]自动生成正则表达式的方法、装置、设备及存储介质有效

专利信息
申请号: 202110725148.1 申请日: 2021-06-29
公开(公告)号: CN113343715B 公开(公告)日: 2023-04-07
发明(设计)人: 蔡远航;王昕远;郑少杰;范增虎 申请(专利权)人: 深圳前海微众银行股份有限公司
主分类号: G06F40/35 分类号: G06F40/35;G06N3/04
代理公司: 北京派特恩知识产权代理有限公司 11270 代理人: 崔晓岚;张颖玲
地址: 518052 广东省深圳市*** 国省代码: 广东;44
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 自动 生成 正则 表达式 方法 装置 设备 存储 介质
【说明书】:

本申请提供一种自动生成正则表达式的方法、自动生成正则表达式的装置、电子设备及计算机可读存储介质,方法包括:获取新增意图的意图表达对应的候选正则表达式集合;获取候选正则表达式集合中的候选正则表达式对于现有意图表达集合的第一命中矩阵;获取候选正则表达式对于新增意图表达集合的第二命中矩阵;确定候选正则表达式集合对应的初始变量矩阵和排序权重矩阵;基于第一命中矩阵、第二命中矩阵、初始变量矩阵和排序权重矩阵,构造人工神经网络;确定改变初始变量矩阵以使人工神经网络的损失函数符合损失条件时,人工神经网络的目标变量矩阵;基于目标变量矩阵,从候选正则表达式中筛选出目标正则表达式。

技术领域

本申请实施例涉及金融科技(Fintech)的数据处理技术领域,涉及但不限于一种自动生成正则表达式的方法、自动生成正则表达式的装置、电子设备及计算机可读存储介质。

背景技术

随着计算机技术的发展,越来越多的技术应用在金融领域,传统金融业正在逐步向金融科技(Fintech)转变,然而,由于金融行业的安全性、实时性要求,金融科技也对技术提出了更高的要求。

金融科技领域下,任务型对话系统越来越多的被应用到实际的场景中,通过对话机器人与用户进行交互,进行对话意图识别。对话意图识别,顾名思义就是判断用户要做什么,比如一个用户向对话机器人问了一个问题,于是对话机器人就需要判断这个用户问的是天气、是旅游还是问要购买电影票。如果是要购买电影票,接下来对话机器人又得判断用户要买哪家电影院,买哪部电影,哪个场次等等。简单而言,对话意图识别就是一个文本分类的问题,首先需要明确有哪几类意图,也就是需要预先定义好意图的类别,然后才能考虑意图识别的问题。

一个对话机器人的意图设置通常是非常复杂的,对话意图识别可以简单视为一个文本分类的问题,目前主流的意图识别算法包括正则表达式:通过人工分析每个意图点下的所有意图表达,总结出正则表达式,然后将用户的输入语句进行预处理后套用已有的模板,如果命中了某个意图模板,则识别成功。

然而,一个对话机器人通常包含了几百个大大小小的意图,所有的意图表达加起来有数几千甚至上万的量级。目前由人工对这些意图表达进行分析,并总结正则表达式,同时还要满足不同意图的正则表达式之间互斥,即两个不同的意图不能包含相同语义的正则表达式,由此导致正则表达式人工维护成本高,难以扩展。

发明内容

本申请实施例提供一种自动生成正则表达式的方法、自动生成正则表达式的装置、电子设备及计算机可读存储介质,以解决相关技术中正则表达式人工维护成本高,难以扩展的问题。

本申请实施例的技术方案是这样实现的:

本申请实施例提供一种自动生成正则表达式的方法,包括:

获取新增意图的意图表达对应的候选正则表达式集合;

获取所述候选正则表达式集合中的候选正则表达式对于现有意图表达集合的第一命中矩阵;

获取所述候选正则表达式对于新增意图表达集合的第二命中矩阵;

确定所述候选正则表达式集合对应的初始变量矩阵和排序权重矩阵;其中,所述初始变量矩阵用于指示每一所述候选正则表达式对应的分数;所述排序权重矩阵用于指示每一所述候选正则表达式对应的优先级;

基于所述第一命中矩阵、所述第二命中矩阵、所述初始变量矩阵和所述排序权重矩阵,构造人工神经网络;其中,所述初始变量矩阵用于输入所述人工神经网络的第二层;所述第一命中矩阵、所述第二命中矩阵和所述排序权重矩阵用于设置所述人工神经网络的第二层和所述人工神经网络的第三层神经元节点之间的连接权重;

确定改变所述初始变量矩阵以使所述人工神经网络的损失函数符合损失条件时,所述人工神经网络的目标变量矩阵;

基于所述目标变量矩阵,从所述候选正则表达式中筛选出目标正则表达式。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于深圳前海微众银行股份有限公司,未经深圳前海微众银行股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202110725148.1/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top