[发明专利]基于表格问答的自然答案生成系统及其方法在审

专利信息
申请号: 202210505859.2 申请日: 2022-05-10
公开(公告)号: CN114780582A 公开(公告)日: 2022-07-22
发明(设计)人: 奚雪峰;李智;崔志明;左严 申请(专利权)人: 苏州科技大学;江苏新希望科技有限公司
主分类号: G06F16/2452 分类号: G06F16/2452;G06F16/242;G06F16/2455;G06F40/289;G06F40/30;G06N5/02
代理公司: 江苏圣典律师事务所 32237 代理人: 王玉国
地址: 215513 江*** 国省代码: 江苏;32
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 基于 表格 问答 自然 答案 生成 系统 及其 方法
【权利要求书】:

1.基于表格问答的自然答案生成系统,其特征在于:包含数据预处理模块(1)、文本编码模块(2)、结构化查询语句生成模块(3)以及自然答案生成模块(4);所述数据预处理模块(1),对用户提出的问题文本进行中文分词、正则去模糊处理;

所述文本编码模块(2),将用户提出的问题文本与知识库实体转化为计算机形式的数据类型和计算单元;

所述结构化查询语句生成模块(3),根据文本编码生成问题对应的结构化查询语句,包含SELECT子句生成和WHERE子句生成;

所述自然答案生成模块(4),根据生成的结构化查询语句进行自然答案的生成,包含主语生成、谓语生成和宾语生成。

2.根据权利要求1所述的基于表格问答的自然答案生成系统,其特征在于:所述数据预处理模块(1)包含正则表达处理模块(101)和中文分词模块(102);所述正则表达处理模块(101),面向问题文本,采用正则表达式将模糊的数字实体转化为符合知识库存储形式的实体,模糊数字实体包含年份模糊实体、百分比模糊实体和数字模糊实体;所述中文分词模块(102),面向用户提出的中文问题文本,将文本中的词语进行切分,采用分词工具,得到一串词汇序列。

3.根据权利要求1所述的基于表格问答的自然答案生成系统,其特征在于:所述文本编码模块(2)包含问题文本编码模块(201)和知识库实体编码模块(202),问题文本编码模块(201)用于问题文本的编码向量表示,知识库实体编码模块(202)用于知识库实体的编码向量表示。

4.根据权利要求1或3所述的基于表格问答的自然答案生成系统,其特征在于:所述文本编码模块(2),将数据预处理模块(1)处理后的问题文本数据和知识库实体进行数学化表示,并将高位向量映射到欧式空间的高维空间中,采用独热编码,将文本编码成可理解和处理的编码序列,通过预训练模型进行对应文本语义特征获取。

5.根据权利要求1所述的基于表格问答的自然答案生成系统,其特征在于:所述结构化查询语句生成模块(3)包含SELECT子句生成模块(301)和WHERE子句生成模块(302);所述SELECT子句生成模块(301),采用预训练模型训练生成问题文本与知识库实体的词向量后,通过多分类模型Softmax进行SELECT子句生成,SELECT子句包含列名选取以及聚合函数的选取;所述WHERE子句生成模块(302),采用预训练模型训练生成问题文本与知识库实体的词向量后,通过多分类模型Softmax进行WHERE子句生成,WHERE子句包含列名选取、操作符号的选取、数值抽取以及条件关联符号选取。

6.根据权利要求1所述的基于表格问答的自然答案生成系统,其特征在于:所述自然答案生成模块(4),将经过结构化查询语句生成模块(3)的SELECT子句生成模块(301)和WHERE子句生成模块(302)后的语句进行拼接形成完整的结构化查询语句,自然答案采用主-谓-宾架构,包含主语生成模块(401)、谓语生成模块(402)以及宾语生成模块(403),主语生成来自SELECT子句生成结果,谓语生成通过已设置的谓语标签{“是”、”有”},基于问题文本进行标签判定生成,谓语部分来完整的结构化查询语句在数据库中的执行结果。

7.基于表格问答的自然答案生成方法,其特征在于:包括以下步骤:

首先,将问答的输入部分,即问题文本与知识库中实体进行数据预处理,问题文本去模糊以及问题文本分词;

然后,将数据预处理之后的问题文本数据以及知识库实体进行独热编码后进入预训练模型进行训练,生成对应相关的词向量;

其次,将特征向量输入结构化查询语句生成模块,通过SELECT子句生成与WHERE子句生成进行拼接,形成完整的SQL;结构化查询语句生成包含六个子任务,每个任务均是多分类模型;基于问题文本和知识库实体的语义表示判定标签类别的概率,概率最高的类别即是最终的输出结果;

最后,依据自然答案生成要求,设计主-谓-宾生成框架,将完整的SQL在数据库中执行获取结果作为宾语生成结果,通过拼接作为最终的自然答案。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于苏州科技大学;江苏新希望科技有限公司,未经苏州科技大学;江苏新希望科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202210505859.2/1.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top