[发明专利]一种可灵活配置、灵活定义的文字识别编改校对系统在审

专利信息
申请号: 201810030535.1 申请日: 2018-01-12
公开(公告)号: CN108170658A 公开(公告)日: 2018-06-15
发明(设计)人: 王长征;员战强;胡志强;刘文晓;梁询 申请(专利权)人: 山西同方知网数字出版技术有限公司
主分类号: G06F17/24 分类号: G06F17/24;G06F17/27;G06K9/34
代理公司: 北京天奇智新知识产权代理有限公司 11340 代理人: 刘黎明
地址: 030006 山西省太*** 国省代码: 山西;14
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 置信度 引擎 灵活定义 灵活配置 文字识别 校对系统 校对 系统运行参数 字符集集合 管理模块 属性信息 图片形成 图像分割 图像识别 要求配置 引擎模块 在线学习 支持模块 质量结果 质量评估 自动分析 归一化 拼版 质检 版面 中断 计算机 修订 评估 分配 配置 图片
【权利要求书】:

1.一种可灵活配置、灵活定义的文字识别编改校对系统,其特征在于,所述系统包括:管理模块、计算机引擎模块和流程支持模块;所述

管理模块,用于对任务的分配、暂停与中断,并根据任务的属性信息进行系统运行参数配置以及根据质量结果要求配置相应的工艺引擎与相似字符集集合;然后根据识别引擎对编改后的结果进行质量评估;

计算机引擎模块,用于对待处理的图片进行版面自动分析、图像分割与图像识别,并将多种识别引擎的识别结果进行“归一化”拼版,根据置信度对比,确定本编改系统的文字置信度,然后根据在线学习,修订编改系统的文字置信度;

流程支持模块,用于支持对待处理图片形成的编改任务,并支持编改校对任务的在编改、校对与质检,以及对编校过的文字质量进行评估控制。

2.如权利要求1所述的可灵活配置、灵活定义的文字识别编改校对系统,其特征在于,所述管理模块包括任务调度中心、流程配置中心及任务监控评估。

3.如权利要求1所述的可灵活配置、灵活定义的文字识别编改校对系统,其特征在于,

所述工艺引擎包括:三识单编、三识双编、双识双编、双识双编+造字;

所述相似字符集包括A类字符集、B类字符集和C类字符集。

4.如权利要求1所述的可灵活配置、灵活定义的文字识别编改校对系统,其特征在于,所述计算机引擎模块包括:版面自动分析引擎、预处理引擎、识别引擎、结果评估引擎及学习引擎;所述

版面自动分析引擎,用于对待处理的图片进行版面自动分析、图像分割和图形识别,并根据识别结果进行相应的版式处理;

预处理引擎,将自动分类后的图片进行预处理;

识别引擎,将版面分析、增强后图片多种识别引擎对分割后文字区域进行OCR识别;

结果评估引擎,将多种识别引擎的识别结果“归一化”拼版,根据置信度对比,确定本编改系统的文字置信度,并确定需要人工校对的文字;

学习引擎,对编校后的结果在线学习,修订相似字符集内容与权重,自动修订编改系统的文字置信度。

5.如权利要求4所述的可灵活配置、灵活定义的文字识别编改校对系统,其特征在于,

所述图像分割包括区分文字区域和非文字区域;

所述图形识别包括识别非文字区域图像特征,包括图形和图像或图形和公式;

所述版式处理包为识别文字区域的排版格式,包括横版或竖版。

6.如权利要求1所述的可灵活配置、灵活定义的文字识别编改校对系统,其特征在于,所述流程支持模块包括:编改校对、质量控制与质量评估;所述

编改校对,对待处理图片的按本/按批形成编改任务,并完成编改校对任务的在编改、校对与质检岗位的领取、编校、完成与提交;

质量控制,对编校过的文字质量控制,在流程上支持不合格的数据返工/改错处理;

质量评估,对编校过的最终产品进行质量要求评估与把控。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于山西同方知网数字出版技术有限公司,未经山西同方知网数字出版技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201810030535.1/1.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top