[发明专利]一种序列标注的方法、装置、电子设备及存储介质在审
申请号: | 202111523218.1 | 申请日: | 2021-12-13 |
公开(公告)号: | CN114238635A | 公开(公告)日: | 2022-03-25 |
发明(设计)人: | 刘瑞雪;袁韶祖;祝天刚;陈蒙 | 申请(专利权)人: | 京东科技信息技术有限公司 |
主分类号: | G06F16/35 | 分类号: | G06F16/35;G06F16/335;G06F40/169;G06F40/205;G06F40/30 |
代理公司: | 北京路浩知识产权代理有限公司 11002 | 代理人: | 吴刚 |
地址: | 100176 北京市大兴区北京经*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 序列 标注 方法 装置 电子设备 存储 介质 | ||
本公开提供一种序列标注的方法、装置、电子设备及存储介质,该方法包括:获取问句和预设的标准数据库表格;切割问句,得到至少一个子句以及子句中的单词,对单词进行角色类型标注,确定每个单词对应的角色类型,对子句进行子句类型标注,确定每个单词所属子句的子句类型;将每个单词的角色类型与标准数据库表格进行级联分类处理,得到每个单词对应的列名;将问句、每个单词及其所属子句的子句类型进行级联分类处理,得到子句对应的运算符号;将每个单词对应的列名以及每个单词所属子句对应的运算符号通过预设规则进行组合,得到逻辑表达语句。该方法较基于深度学习模型的方法设置更加简洁,并且可以有效捕捉问句之间的本地信息。
技术领域
本公开涉及自然语言处理技术领域,尤其涉及一种序列标注的方法、装置、电子设备及存储介质。
背景技术
目前自然语言转化为逻辑表达语句的技术主要有两种方法,基于规则的方法和基于深度学习模型的方法。但两种方法均存在一些缺陷,基于规则的方法,需要设置大量的词典和同义词词典,人力成本较高,并且该方法只能涵盖字典中的词语,灵活性和鲁棒性较差;基于深度学习模型的方法,构建专用模块很复杂,无法捕获相互依赖关系,也无法捕捉语句之间的内部信息。
发明内容
本公开提供一种序列标注的方法、装置、电子设备及存储介质,用以解决现有技术中自然语言转化为逻辑表达语句的问题,实现了设置简洁,并且可以有效捕捉问句之间的本地信息。
第一方面,本公开提供一种序列标注的方法,包括:
获取问句和预设的标准数据库表格;其中,所述标准数据库表格包括列名;
切割所述问句,得到至少一个子句以及子句中的单词,对所述单词进行角色类型标注,确定每个所述单词对应的角色类型,对所述子句进行子句类型标注,确定每个所述单词所属子句的子句类型;
将每个所述单词的角色类型与标准数据库表格进行级联分类处理,得到每个所述单词对应的列名;
将所述问句、每个单词及其所属子句的子句类型进行级联分类处理,得到所述子句对应的运算符号;
将每个单词对应的列名以及每个单词所属子句对应的运算符号通过预设规则进行组合,得到逻辑表达语句。
根据本公开提供的序列标注的方法,所述方法还包括:基于所述逻辑表达语句在所述标准数据库表格中进行查询,获取查询结果。
根据本公开提供的序列标注的方法,所述对所述单词进行角色类型标注,确定每个所述单词对应的角色类型,包括:
对所述单词和所述标准数据库表格中的列名进行拼接,得到整体序列;
将所述整体序列输入至预训练的语言模型中,生成所述整体序列对应的隐向量表示;
对所述问句和每个单词进行注意力机制运算,得到所述问句的注意力表示;
将所述隐向量表示和所述问句的注意力表示进行合并得到合并结果,将所述合并结果输入至角色类型标注模型中,得到每个所述单词对应的角色类型,其中,所述角色类型包括初始列名或初始列值。
根据本公开提供的序列标注的方法,所述对所述子句进行子句类型标注,确定每个所述单词所属子句的子句类型,包括:
将所述隐向量表示和所述问句的注意力表示进行合并得到合并结果,将所述合并结果输入至子句类型标注模型中,得到每个所述单词所属子句的子句类型。
根据本公开提供的序列标注的方法,所述将每个所述单词的角色类型与标准数据库表格进行级联分类处理,得到每个所述单词对应的列名,包括:
将所述标准数据库表格中列名的隐向量表示和每个单词对应的角色类型进行注意力机制的交互匹配;
根据匹配结果获取每个所述单词对应的列名。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于京东科技信息技术有限公司,未经京东科技信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111523218.1/2.html,转载请声明来源钻瓜专利网。