[发明专利]一种可灵活配置、灵活定义的文字识别编改校对系统在审

专利信息
申请号: 201810030535.1 申请日: 2018-01-12
公开(公告)号: CN108170658A 公开(公告)日: 2018-06-15
发明(设计)人: 王长征;员战强;胡志强;刘文晓;梁询 申请(专利权)人: 山西同方知网数字出版技术有限公司
主分类号: G06F17/24 分类号: G06F17/24;G06F17/27;G06K9/34
代理公司: 北京天奇智新知识产权代理有限公司 11340 代理人: 刘黎明
地址: 030006 山西省太*** 国省代码: 山西;14
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 置信度 引擎 灵活定义 灵活配置 文字识别 校对系统 校对 系统运行参数 字符集集合 管理模块 属性信息 图片形成 图像分割 图像识别 要求配置 引擎模块 在线学习 支持模块 质量结果 质量评估 自动分析 归一化 拼版 质检 版面 中断 计算机 修订 评估 分配 配置 图片
【说明书】:

发明公开了一种可灵活配置、灵活定义的文字识别编改校对系统,包括:所述管理模块,用于对任务的分配、暂停与中断,并根据任务的属性信息进行系统运行参数配置以及根据质量结果要求配置相应的工艺引擎与相似字符集集合;然后根据识别引擎对编改后的结果进行质量评估;计算机引擎模块,用于对待处理的图片进行版面自动分析、图像分割与图像识别,并将多种识别引擎的识别结果进行“归一化”拼版,根据置信度对比,确定本编改系统的文字置信度,然后根据在线学习,修订编改系统的文字置信度;流程支持模块,用于支持对待处理图片形成的编改任务,并支持编改校对任务的在编改、校对与质检,以及对编校过的文字质量进行评估控制。

技术领域

本发明涉及文献数字化、数字出版、文献大数据构建技术领域,尤其涉及一种可灵活配置、灵活定义的文字识别编改校对系统。

背景技术

在纸质格式文件加工转换成设定数字格式电子化文件的过程中,通过识别后的文字编改,需要耗费极大的人力。目前的应用,现有的系统采用普通的OCR识别软件识别后,再进行人工的编改,编改的质量完全取决于人工的编改质量,存在编改结果文字质量不可控,人工编校量大、编校效率低、人工成本高的问题。

发明内容

为解决现有编改中人工编改效率低、错误率高、人工成本高的现状,本发明的目的是提供一种可灵活配置、灵活定义的文字识别编改校对系统。

本发明的目的通过以下的技术方案来实现:

一种可灵活配置、灵活定义的文字识别编改校对系统,包括:包括:管理模块、计算机引擎模块和流程支持模块;所述

管理模块,用于对任务的分配、暂停与中断,并根据任务的属性信息进行系统运行参数配置以及根据质量结果要求配置相应的工艺引擎与相似字符集集合;然后根据识别引擎对编改后的结果进行质量评估;

计算机引擎模块,用于对待处理的图片进行版面自动分析、图像分割与图像识别,并将多种识别引擎的识别结果进行“归一化”拼版,根据置信度对比,确定本编改系统的文字置信度,然后根据在线学习,修订编改系统的文字置信度;

流程支持模块,用于支持对待处理图片形成的编改任务,并支持编改校对任务的在编改、校对与质检,以及对编校过的文字质量进行评估控制。

与现有技术相比,本发明的一个或多个实施例可以具有如下优点:

本发明适用于纸质文献数字化、数字出版、文献大数据构建等领域,通过管理模块、计算机引擎模块、流程支持模块,有效的实现了根据任务的紧急程度、人员设备的属性信息等进行任务的流程灵活配置,从而达到资源利用率最高、任务消耗时间最短的目标;有效的实现了根据输出物的质量要求,配置想对应的工艺引擎,从而达到质量保障。提升了文字质量,解决了普通编校系统的文字质量不可控的问题;降低了人工编校的工作量,降低了编校成本;工艺引擎灵活可配置,适合了文字编校灵活配置的要求。

附图说明

图1是可灵活配置、灵活定义的文字识别编改校对系统结构图;

图2是可灵活配置、灵活定义的文字识别编改校对系统中工艺引擎结构图;

图3是可灵活配置、灵活定义的文字识别编改校对系统中计算机引擎结构流程图。

具体实施方式

为使本发明的目的、技术方案和优点更加清楚,下面将结合实施例及附图对本发明作进一步详细的描述。

如图1所示,为可灵活配置、灵活定义的文字识别编改校对系统结,包括:管理模块、计算机引擎模块和流程支持模块;所述

管理模块,用于对任务的分配、暂停与中断,并根据任务的属性信息进行系统运行参数配置以及根据质量结果要求配置相应的工艺引擎与相似字符集集合;然后根据识别引擎对编改后的结果进行质量评估;

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于山西同方知网数字出版技术有限公司,未经山西同方知网数字出版技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201810030535.1/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top