[发明专利]文本信息的提取方法和装置、存储介质和电子设备在审

专利信息
申请号: 202110041856.3 申请日: 2021-01-13
公开(公告)号: CN112732893A 公开(公告)日: 2021-04-30
发明(设计)人: 薛小娜;付骁弈 申请(专利权)人: 上海明略人工智能(集团)有限公司
主分类号: G06F16/335 分类号: G06F16/335;G06F40/289;G06F40/284;G06F40/205
代理公司: 北京华夏泰和知识产权代理有限公司 11662 代理人: 刘晓燕;黄巍
地址: 200030 上海市徐汇区*** 国省代码: 上海;31
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 文本 信息 提取 方法 装置 存储 介质 电子设备
【权利要求书】:

1.一种文本信息的提取方法,其特征在于,所述方法包括:

使用目标关键词从目标文本数据中获取目标子文本数据,其中,所述目标子文本数据的最后一个关键词为所述目标关键词;

根据所述目标子文本数据包含的词语的词性,从所述目标子文本数据中提取出与所述目标关键词具有关联关系的至少一个关联词;

获取与所述目标子文本对应的目标文本信息,其中,所述目标文本信息包含至少一个所述关联词和所述目标关键词,所述目标文本信息用于标识一个业务对象。

2.根据权利要求1所述的方法,其特征在于,所述使用目标关键词从目标文本数据中获取目标子文本数据包括:

使用所述目标关键词从所述目标文本数据中获取多个子文本数据,其中,每个所述子文本数据的最后一个关键词为所述目标关键词;

从多个所述子文本数据中选取一个子文本数据,得到所述目标子文本数据。

3.根据权利要求1所述的方法,其特征在于,所述根据所述目标子文本数据包含的词语的词性,从所述目标子文本数据中提取出与所述目标关键词具有关联关系的至少一个关联词包括:

对所述目标子文本中包含的多个参考词进行词性分析,确定每个所述参考词的词性;

根据每个所述参考词的词性,从多个所述参考词中提取出至少一个所述关联词,其中,每个所述关联词的词性与所述目标关键词的词性相同。

4.根据权利要求3所述的方法,其特征在于,所述根据每个所述参考词的词性,从多个所述参考词中提取出至少一个所述关联词包括:

将多个所述参考词中与所述目标关键词相邻、且与所述目标关键词的词性相同的至少一个参考词,确定为至少一个所述关联词,其中,在所述关联词为多个的情况下,多个所述关联词在所述目标子文本数据中的位置连续。

5.根据权利要求4所述的方法,其特征在于,所述将多个所述参考词中与所述目标关键词相邻、且与所述目标关键词的词性相同的至少一个参考词,确定为至少一个所述关联词包括:

按照由后到前的顺序,从多个所述参考词中依次选取出一个参考词,作为一个所述关联词,直到选取出的参考词的词性与所述目标关键词的词性不同,得到至少一个所述关联词。

6.根据权利要求4所述的方法,其特征在于,所述将多个所述参考词中与所述目标关键词相邻、且与所述目标关键词的词性相同的至少一个参考词,确定为至少一个所述关联词包括:

按照由前到后的顺序,从多个所述参考词中依次选取出一个参考词,作为当前参考词;

在所述当前参考词的词性与所述目标关键词的词性相同的情况下,将所述当前参考词确定为一个候选词;

在所述当前参考词的词性与所述目标关键词的词性不同的情况下,删除当前已确定的所述候选词;

在多个所述参考词均已被选取的情况下,将当前已确定的至少一个所述候选词,确定为至少一个所述关联词。

7.根据权利要求1至6任一项所述的方法,其特征在于,在获取与所述目标子文本对应的目标文本信息之后,所述方法还包括:

从所述目标文本信息的上下文信息中,获取候选状态信息,其中,所述候选状态信息用于描述所述业务对象的业务状态;

将所述候选状态信息与多个参考状态信息进行匹配,其中,所述参考状态信息是根据所述业务对象的历史业务状态信息确定的;

在所述候选状态信息与所述多个参考状态信息中的目标状态信息的匹配程度大于或者等于匹配阈值的情况下,将所述目标状态信息,确定为所述业务对象的业务状态信息。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海明略人工智能(集团)有限公司,未经上海明略人工智能(集团)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202110041856.3/1.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top