[发明专利]基于长文本的信息抽取方法、装置、计算机设备及介质在审
| 申请号: | 202210268965.3 | 申请日: | 2022-03-18 |
| 公开(公告)号: | CN114757165A | 公开(公告)日: | 2022-07-15 |
| 发明(设计)人: | 邹伟东;黄威威;蔡子哲 | 申请(专利权)人: | 企知道网络技术有限公司 |
| 主分类号: | G06F40/205 | 分类号: | G06F40/205 |
| 代理公司: | 暂无信息 | 代理人: | 暂无信息 |
| 地址: | 518051 广东省深圳市南山区西丽*** | 国省代码: | 广东;44 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 基于 文本 信息 抽取 方法 装置 计算机 设备 介质 | ||
1.一种基于长文本的信息抽取方法,其特征在于,包括:
获取长文本段;
采用逻辑分割符号分割所述长文本段生成至少两个短文本;
根据每一所述短文本获取序列片段和片段链接信息;
基于所述序列片段和片段链接信息,生成与所述长文本对应的逻辑信息;
根据所述长文本段的内容中存在的所述逻辑信息以及客户端的查询请求,提供与所述查询请求相关的内容给所述客户端。
2.根据权利要求1所述的基于长文本的信息抽取方法,其特征在于,所述逻辑信息包括至少两个条件单元;
所述生成与所述长文本对应的逻辑信息,包括:
获取所有所述短文本之间的第一与或关系;
基于所述第一与或关系,获取所有所述条件单元之间的第二与或关系。
3.根据权利要求2所述的基于长文本的信息抽取方法,其特征在于,所述条件单元包括短文本序号和条件单元序号;
所述基于所述第一与或关系,获取所有所述条件单元之间的第二与或关系,包括:
通过所述短文本序号对所述第一与或关系进行编码,形成第一编码;
基于所述第二与或关系,将所述第一编码中的所有所述短文本序号替换为所述条件单元序号。
4.根据权利要求1所述的基于长文本的信息抽取方法,其特征在于,在所述获取长文本段之前,还包括:
采用基于自注意力机制的bert-crf模型,获取命名实体识别ner;
通过在bert输出层构建逻辑关系矩阵,从而识别每一所述短文本之间的片段链接,并表达逻辑关系;
通过所述命名实体识别ner与所述逻辑关系进行相加,获取模型损失函数,并通过梯度下降算法最小化所述模型损失函数,获取最小化损失函数;
基于所述最小化损失函数,训练出条件单元抽取模型,所述条件单元抽取模型用于提取所述序列片段对应的逻辑信息。
5.根据权利要求1所述的基于长文本的信息抽取方法,其特征在于,在所述获取长文本段之前,还包括:
获取所述长文本段的一般分割符号和逻辑层级关系,确定所述长文本段对应的逻辑分割符号。
6.根据权利要求1所述的基于长文本的信息抽取方法,其特征在于,所述生成与所述长文本对应的逻辑信息,包括:
采用上下文语法结构和/或关键词分析所述逻辑信息,生成与所述长文本对应的逻辑信息,所述逻辑信息包括所述短文本之间的第一级与或关系,和所述短文本内部的第二级与或关系。
7.根据权利要求1所述的基于长文本的信息抽取方法,其特征在于,所述根据所述长文本段的内容中存在的所述逻辑信息以及客户端的查询请求,提供与所述查询请求相关的内容给所述客户端,包括:
获取所述客户端发送的条件匹配请求,所述条件匹配请求包括待评估对象ID;
基于评估对象数据库,生成所述评估对象ID对应的待评估信息;
比对所述待评估信息和所述逻辑信息,若比对结果为两者一致,则返回所述待评估对象符合逻辑关系的提示。
8.一种基于长文本的信息抽取装置,其特征在于,包括:
获取长文本段模块,用于获取长文本段;
生成短文本模块,用于采用逻辑分割符号分割所述长文本段生成至少两个短文本;
获取序列片段模块,用于根据每一所述短文本获取序列片段和片段链接信息;
生成逻辑信息模块,用于基于所述序列片段和片段链接信息,生成与所述长文本对应的逻辑信息;
提供相关内容模块,用于根据所述长文本段的内容中存在的所述逻辑信息以及客户端的查询请求,提供与所述查询请求相关的内容给所述客户端。
9.一种计算机设备,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现如权利要求1至7任一项所述基于长文本的信息抽取方法。
10.一种计算机可读介质,所述计算机可读介质存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1至7任一项所述基于长文本的信息抽取方法。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于企知道网络技术有限公司,未经企知道网络技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210268965.3/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种基于图学习的联合空时机会检测方法
- 下一篇:基于眼电的电饭煲控制系统
- 信息记录介质、信息记录方法、信息记录设备、信息再现方法和信息再现设备
- 信息记录装置、信息记录方法、信息记录介质、信息复制装置和信息复制方法
- 信息记录装置、信息再现装置、信息记录方法、信息再现方法、信息记录程序、信息再现程序、以及信息记录介质
- 信息记录装置、信息再现装置、信息记录方法、信息再现方法、信息记录程序、信息再现程序、以及信息记录介质
- 信息记录设备、信息重放设备、信息记录方法、信息重放方法、以及信息记录介质
- 信息存储介质、信息记录方法、信息重放方法、信息记录设备、以及信息重放设备
- 信息存储介质、信息记录方法、信息回放方法、信息记录设备和信息回放设备
- 信息记录介质、信息记录方法、信息记录装置、信息再现方法和信息再现装置
- 信息终端,信息终端的信息呈现方法和信息呈现程序
- 信息创建、信息发送方法及信息创建、信息发送装置





