[发明专利]一种上下文相关语义解析方法在审
申请号: | 202111524256.9 | 申请日: | 2021-12-14 |
公开(公告)号: | CN114201506A | 公开(公告)日: | 2022-03-18 |
发明(设计)人: | 陈观林;余皆毅;李甜;杨武剑;翁文勇 | 申请(专利权)人: | 浙大城市学院 |
主分类号: | G06F16/242 | 分类号: | G06F16/242;G06F16/33;G06F40/211;G06F40/30 |
代理公司: | 杭州九洲专利事务所有限公司 33101 | 代理人: | 张羽振 |
地址: | 310015 浙*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 上下文 相关 语义 解析 方法 | ||
1.一种上下文相关语义解析方法,其特征在于,包括以下步骤:
S1、使用ERNIE对数据进行编码,将问题文本和数据库的表和列依次排列,作为Alignment-Rect-Augmented NL2SQL模型的初始输入,得到问题文本和数据库模式的编码表示;
xinput=(q1,q2,...,qi,t1,t2,...,tj,c1,c2,...,ck)
上式中,qi表示问题文本的每个字符元素,i为问题文本的字符元素总数;tj表示数据库中的每个表的名称,j为数据库表格总数;ck表示数据库中相应表下的列名,k为数据库中存在列名的总数;
S2、使用当前的文本编码和前几轮的文本编码更新注意力;
S3、使用步骤S2得到的问题文本编码和上一轮的对齐矩阵进行注意力操作,生成的状态追踪对齐矩阵与真实标签做交叉熵计算;对齐矩阵是问题文本和数据库模式之间的共享信息,将问题文本和数据库模式之间的关系进行对齐,加入当前轮的对话信息校正当前轮次的对齐矩阵的对齐问题;
S4、使用n_gram的方式来计算对齐矩阵的相关性,利用相关性Schema-Linking获取对齐矩阵的相关性,得到相关性对齐矩阵:首先确定n_gram的长度,对问题文本进行搜索,列举问题文本中n_gram长度以内存在的词或语句;分别使用候选片段、表名与列名进行相关性计算,将相关性计算结果与设置的阈值进行比较;若相关性计算结果大于阈值时,将与表名相关的候选片段设为CES,将与列名相关的候选片段设为TES,不相关的候选片段设为NONE;
S5、利用步骤S3和步骤S4得到状态追踪对齐矩阵和相关性对齐矩阵进行融合计算,得到当前的对齐矩阵;
S6、利用步骤S5得到对齐矩阵替换NL2SQL的神经网络模型中的对齐矩阵,将对齐矩阵带入步骤S3中,训练得到的Alignment-Rect-Augmented NL2SQL模型。
2.根据权利要求1所述上下文相关语义解析方法,其特征在于,步骤S2具体为:
历史信息追踪注意力机制捕捉当前轮次的问题文本和历史问题文本之间的相互关系,在当前轮次t中,使用点积注意力的方式计算当前轮次的问题文本编码和历史问题文本编码之间的注意力权重,然后将历史问题文本编码通过加权平均的方式和当前问题文本编码相加,得到的
αturn=softmax(si)
上式中,是前几个轮次的词嵌入,是当前轮次的词嵌入,Wturn-att是待学习的参数,αturn是学习到的之前轮次的问题文本编码对当前轮次的注意力权重,是经过历史注意力更新后的问题文本编码;用来描述当前的带语境的信息。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于浙大城市学院,未经浙大城市学院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111524256.9/1.html,转载请声明来源钻瓜专利网。