[发明专利]一种基于语义关联性的文本错误识别方法及系统在审
申请号: | 202010820199.8 | 申请日: | 2020-08-14 |
公开(公告)号: | CN112069268A | 公开(公告)日: | 2020-12-11 |
发明(设计)人: | 蓝建敏;池沐霖 | 申请(专利权)人: | 京华信息科技股份有限公司 |
主分类号: | G06F16/28 | 分类号: | G06F16/28;G06F16/245;G06F40/30 |
代理公司: | 广州三环专利商标代理有限公司 44202 | 代理人: | 郭浩辉;麦小婵 |
地址: | 510520 广东省广州*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 语义 关联性 文本 错误 识别 方法 系统 | ||
本发明涉及一种基于语义关联性的文本错误识别方法,包括:获取文本中的人员信息,为第一信息;根据所述人员信息从预先建立的数据库中提取预置人员信息,为第二信息;判断所述第二信息与所述第一信息是否一致,获得判断结果;若所述判断结果为是,则所述文本正确;若所述判断结果为否,则所述文本错误。本发明将文本信息中的人员信息与预先建立的数据库中的预置人员信息进行对比,可以对公文文本中的人名前置后置称谓和人员排序进行校正。
技术领域
本发明涉及文本错误识别技术领域,特别是涉及一种基于语义关联性的文本错误识别方法及系统。
背景技术
随着信息化时代的发展,人工智能技术的进步,中文文本自动校对技术取得了一定发展。目前的文本校对技术主要包括三种:一是根据预设数据库检查、校对文稿中的职务、名字信息;二是基于知识图谱的中文文本校对方法,从错别字、成分缺失与定义矛盾三个方面对文本进行语义校对;三是通过研究中文语义提取、中文语义查错和中文语义纠正相关关键技术,实现基于本体一致性验证推理的中文语义校对。
但是对于公文文本,由于公文文本具有特殊性,现有的文本校对技术对于公文校对还存在一定局限性。因此如何有效校对公文是否规范、正确,是一个亟需解决的问题。
发明内容
本发明的目的是提供一种基于语义关联性的文本错误识别方法及系统,以实现校正公文文本中人名的前置后置称谓和人员排序。
为实现上述目的,本发明提供了如下方案:
一种基于语义关联性的文本错误识别方法,包括
获取文本中的人员信息,为第一信息;
根据所述人员信息从预先建立的数据库中提取预置人员信息,为第二信息;
判断所述第二信息与所述第一信息是否一致,获得判断结果;
若所述判断结果为是,则所述文本正确;
若所述判断结果为否,则所述文本错误。
可选的,所述第一信息包括人名、称谓信息和人员排序信息。
可选的,所述数据库中包含现有的人员人名信息、人员称谓信息和人员排序信息。
一种基于语义关联性的文本错误识别系统,包括
第一获取模块,用于获取文本中的人员信息,为第一信息;
第二获取模块,用于根据所述人员信息从预先建立的数据库中提取预置人员信息,为第二信息;
判断模块,用于判断所述第二信息与所述第一信息是否一致,获得判断结果;
第一执行模块,用于当所述判断结果为是时,判定所述文本正确;
第二执行模块,用于当所述判断结果为否时,判定所述文本错误。
根据本发明提供的具体实施例,本发明公开了以下技术效果:
本发明公开了一种基于语义关联性的文本错误识别方法,包括:获取文本中的人员信息,为第一信息;根据所述人员信息从预先建立的数据库中提取预置人员信息,为第二信息;判断所述第二信息与所述第一信息是否一致,获得判断结果;若所述判断结果为是,则所述文本正确;若所述判断结果为否,则所述文本错误。本发明将文本信息中的人员信息与预先建立的数据库中的预置人员信息进行对比,可以对公文文本中的人名前置后置称谓和人员排序进行校正。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于京华信息科技股份有限公司,未经京华信息科技股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010820199.8/2.html,转载请声明来源钻瓜专利网。