[发明专利]实体关系的识别方法、装置及电子设备有效
申请号: | 202011461566.6 | 申请日: | 2020-12-14 |
公开(公告)号: | CN112270196B | 公开(公告)日: | 2022-04-29 |
发明(设计)人: | 张浩静;刘炎;覃建策;陈邦忠 | 申请(专利权)人: | 完美世界(北京)软件科技发展有限公司 |
主分类号: | G06F40/295 | 分类号: | G06F40/295;G06F16/35 |
代理公司: | 北京中强智尚知识产权代理有限公司 11448 | 代理人: | 黄耀威 |
地址: | 100085 北京市海淀*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 实体 关系 识别 方法 装置 电子设备 | ||
本申请公开了一种实体关系的识别方法、装置及电子设备,涉及数据识别技术领域。其中方法包括:首先将待识别文本中缺少主语的语句进行主语补齐处理;再获取经过主语补齐处理后的所述待识别文本中含有实体对的语句;获取所述实体对中实体对应的实体信息特征;然后将所述实体信息特征、实体对、以及所述含有实体对的语句输入到深度学习的预设识别模型中;最后根据所述预设识别模型输出的分类结果,确定所述待识别文本中的实体关系。本申请可去除一些冗余、无关的文本数据,进而尽量去除噪音文本数据,增加有效文本数据比例,能够有效提升识别模型的准确率,且模型训练也会更加迅速。从而可提高实体关系识别的准确率和效率。
技术领域
本申请涉及数据识别技术领域,尤其是涉及到一种实体关系的识别方法、装置及电子设备。
背景技术
进入互联网时代,人们交流沟通变得快速便捷,与此同时各种社交软件每时每刻都在产生大量的文本数据。为了让人们的生活体验越来越好、生活质量越来越高,需要充分利用产生的大量文本数据,通过自然语言处理技术进行最优最快的智能匹配,节省时间、提高效率。这样就需要将产生的文本数据进行结构化处理,例如生成知识图谱。而生成知识图谱过程的关键步骤之一就是进行实体关系抽取,生成{头实体,关系,尾实体}这样的三元组,以更有效地分析复杂关系中存在的特定潜在的内容,更好的服务与人们的日常生活。
目前,传统方案中利用远程监督算法进行实体关系的识别抽取,前期需要有一个小型知识图谱作为初始三元组,且由于远程监督的强假设条件,会引入大量的噪音,得到的实体关系抽取结果不是很准确,进而会影响实体关系的识别准确性。
发明内容
有鉴于此,本申请提供了一种实体关系的识别方法、装置及电子设备,主要目的在于改善目前现有技术中会影响实体关系识别准确性的技术问题。
依据本申请的一个方面,提供了一种实体关系的识别方法,该方法包括:
将待识别文本中缺少主语的语句进行主语补齐处理;
获取经过主语补齐处理后的所述待识别文本中含有实体对的语句;
获取所述实体对中实体对应的实体信息特征;
将所述实体信息特征、实体对、以及所述含有实体对的语句输入到深度学习的预设识别模型中;
根据所述预设识别模型输出的分类结果,确定所述待识别文本中的实体关系。
依据本申请的另一方面,提供了一种实体关系的识别装置,该装置包括:
处理模块,用于将待识别文本中缺少主语的语句进行主语补齐处理;
获取模块,用于获取经过主语补齐处理后的所述待识别文本中含有实体对的语句;
所述获取模块,还用于获取所述实体对中实体对应的实体信息特征;
输入模块,用于将所述实体信息特征、实体对、以及所述含有实体对的语句输入到深度学习的预设识别模型中;
确定模块,用于根据所述预设识别模型输出的分类结果,确定所述待识别文本中的实体关系。
依据本申请又一个方面,提供了一种存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现上述实体关系的识别方法。
依据本申请再一个方面,提供了一种电子设备,包括存储介质、处理器及存储在存储介质上并可在处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现上述实体关系的识别方法。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于完美世界(北京)软件科技发展有限公司,未经完美世界(北京)软件科技发展有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011461566.6/2.html,转载请声明来源钻瓜专利网。