[发明专利]文本信息处理方法及其装置、存储介质在审
申请号: | 202110545929.2 | 申请日: | 2021-05-19 |
公开(公告)号: | CN113128196A | 公开(公告)日: | 2021-07-16 |
发明(设计)人: | 蒋乐怡 | 申请(专利权)人: | 腾讯科技(深圳)有限公司 |
主分类号: | G06F40/194 | 分类号: | G06F40/194;G06F40/295;G06F40/30;G06F16/35;G06N20/00 |
代理公司: | 广州嘉权专利商标事务所有限公司 44205 | 代理人: | 谭英强;梁嘉琦 |
地址: | 518000 广东省深圳*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 文本 信息处理 方法 及其 装置 存储 介质 | ||
本申请公开了一种文本信息处理方法及其装置、存储介质,先获取待处理文本并识别待处理文本中的目标主体名称,然后判断目标主体名称的名称类型与预先获取的候选实体名称的名称类型的一致性,当判断结果为一致,计算目标主体名称与候选实体名称的相似度参数,并将符合匹配条件的相似度参数对应的候选实体名称确定为目标实体名称;当判断结果为不一致,获取与目标主体名称匹配的目标备选主体名称,获取目标备选主体名称的映射属性信息,根据映射属性信息确定目标实体名称。因此,本申请实施例提供的方案能够不受名称类型是否相一致的影响,从而能够提高文本信息的匹配准确性。可见,本申请可以广泛应用于自然语言处理技术中。
技术领域
本申请涉及自然语言处理技术,尤其是一种文本信息处理方法及其装置、存储介质。
背景技术
随着人工智能(Artificial Intelligence,AI)技术的发展和具体领域的应用需求的不断增长,将人工智能技术应用到诸如支付金融领域等具体领域的研究得到了发展。其中,自然语言处理(Natural Language Processing,NLP)技术为人工智能技术的重要分支。其中,文本信息的识别及匹配是自然语言处理技术中的重要任务,例如在某些应用场景中,需要对待处理文本中描述的目标主体名称进行识别,并将该目标主体名称与某一目标实体名称进行匹配。
然而,如果待处理文本中描述的目标主体名称不规范,那么,在使用目前常用的文本处理方式将该目标主体名称与目标实体名称进行匹配时,将难以得到准确的匹配结果。
发明内容
以下是对本文详细描述的主题的概述。本概述并非是为了限制权利要求的保护范围。
本申请实施例提供了一种文本信息处理方法、文本信息处理装置及计算机可读存储介质,能够提高文本信息的匹配准确性。
一方面,本申请实施例提供了一种文本信息处理方法,包括以下步骤:
获取待处理文本;
识别所述待处理文本中的目标主体名称;
获取候选实体名称;
判断所述目标主体名称的名称类型与所述候选实体名称的名称类型的一致性;
当所述目标主体名称的名称类型与所述候选实体名称的名称类型相一致,计算所述目标主体名称与所述候选实体名称的相似度参数,将符合匹配条件的相似度参数对应的候选实体名称,确定为所述目标主体名称对应的目标实体名称;
当所述目标主体名称的名称类型与所述候选实体名称的名称类型不一致,获取与所述目标主体名称匹配的目标备选主体名称,获取所述目标备选主体名称的映射属性信息,根据所述映射属性信息确定所述目标主体名称对应的目标实体名称。
另一方面,本申请实施例还提供了一种文本信息处理装置,包括:
文本获取单元,用于获取待处理文本;
主体识别单元,用于识别所述待处理文本中的目标主体名称;
实体获取单元,用于获取候选实体名称;
类型判断单元,用于判断所述目标主体名称的名称类型与所述候选实体名称的名称类型的一致性;
实体确定单元,用于当所述目标主体名称的名称类型与所述候选实体名称的名称类型相一致,计算所述目标主体名称与所述候选实体名称的相似度参数,将符合匹配条件的相似度参数对应的候选实体名称,确定为所述目标主体名称对应的目标实体名称;
所述实体确定单元,还用于当所述目标主体名称的名称类型与所述候选实体名称的名称类型不一致,获取与所述目标主体名称匹配的目标备选主体名称,获取所述目标备选主体名称的映射属性信息,根据所述映射属性信息确定所述目标主体名称对应的目标实体名称。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于腾讯科技(深圳)有限公司,未经腾讯科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110545929.2/2.html,转载请声明来源钻瓜专利网。