[发明专利]形态学先验约束的甲骨文字检测的图像数据集构建方法有效

专利信息
申请号: 202110822165.7 申请日: 2021-07-20
公开(公告)号: CN113362361B 公开(公告)日: 2023-09-05
发明(设计)人: 宋传鸣;何熠辉;王一琦;洪飏;王相海 申请(专利权)人: 辽宁师范大学
主分类号: G06T7/155 分类号: G06T7/155;G06T7/62;G06T7/70;G06T5/40
代理公司: 大连非凡专利事务所 21220 代理人: 闪红霞
地址: 116000 辽宁*** 国省代码: 辽宁;21
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 形态学 先验 约束 甲骨 文字 检测 图像 数据 构建 方法
【说明书】:

发明公开一种形态学先验约束的甲骨文字检测的图像数据集构建方法,是从实甲骨拓片图像中提取不含噪声的单字图像以及含有点状噪声、片状斑纹和固有纹理的干扰元素图像,分别组成单字字形图像数据集和干扰元素数据集;利用二值掩膜提取有效字形区域的像素,以甲骨文字形态学特征为约束,通过随机旋转、缩放和基于二值掩膜的位运算,生成无噪声的甲骨拓片模拟图像;然后,通过直方图扫描来定位文字区域的包围盒,进而生成符合VOC2007规范的XML标注文件;通过随机旋转、缩放、二值掩膜的方式,将干扰元素与单字图像进行叠加,构建了面向甲骨卜辞文字检测的图像数据集。

技术领域

本发明涉及数字图像处理和古文字信息处理的交叉领域,尤其是一种可有效解决甲骨卜辞拓片图像数据集有限、甲骨文字检测数据集匮乏且标注困难的问题,能反映真实甲骨拓片图像的文字、噪声和固有纹理的特点,构建效率高、可扩展能力强、具备自动标注能力、标注精度高、形态学先验约束的面向甲骨文字检测的图像数据集构建方法。

背景技术

甲骨文字检测是计算甲骨学的重要基础研究领域之一,其根本目的是借助计算机视觉技术,在甲骨拓片图像上自动定位甲骨卜辞文字的区域位置,进而为刻辞文本识别及语义释读等环节提供字形图像或字形图像集合。它对于保证后续的文字分割和字形复原质量、提高字形特征提取和自动识别精度具有基础且重要的意义,亦是计算机辅助甲骨文字形研究、碎片缀合、文意释读等研究工作的基础任务。为了实现高效率的基于计算机视觉技术的甲骨卜辞文字检测以及对其检测结果进行公平测试和客观评价,建立具有一定规模的甲骨拓片图像数据集是必不可少的基础研究步骤之一。然而,具有权威性的甲骨卜辞图像公开数据集目前十分有限,公开的甲骨卜辞文字检测数据集更是极其匮乏。

一方面,研究者普遍认可的数据大多源自1978-1982年郭沫若主编的《甲骨文合集》一书,书中选录了殷墟出土的甲骨拓本、照片和摹本共41956片。遗憾的是,该数据集经过数字化后,并不具备满足深度学习要求的训练条件,其数据规模有限且未提供文本标注。而且,传统的可视化标注工具对标注者的业务能力有较高要求,标注者既须非常熟悉甲骨文字形,明确区分固有纹理、沟壑裂痕、钻凿坑洞等干扰元素与字形本身,还需具备一定的甲骨文释读能力,能够大体区分特定场景下形态相似的多个单体字抑或是上下、左右结构的合体字。在这种近乎苛刻的严格要求下,即使研究人员花费大量精力对该图像数据集进行手工标注,由于个人素质、技能程度等因素所导致的训练数据标注标准不统一、标注精度无法保证、标注效率低下等问题也是尤为突出的。另一方面,尽管文档分析与识别国际会议(International Conference on Document Analysis and Recognition,ICDAR)面向文本检测和识别公开了一种ICDAR数据集,但是该数据集却仅包含现代文字,它呈现出与真实甲骨拓片完全不同的特征,根本无法实际应用于甲骨卜辞文字的检测任务。与ICDAR提供的数据相比,甲骨卜辞文字的拓片图像夹杂着更为显著的噪声干扰,既含有在甲骨拓取、拍摄、扫描过程中由于技术设备等因素造成的噪声,又存在大量的由于钻凿、炙烤、风蚀、腐化等原因造成的空洞、裂痕甚至碎裂现象,而且龟甲和兽骨本身还具有齿缝、兆纹、盾纹、刻痕等纹理。这些明显有别于自然环境下文本检测场景的复杂干扰,导致甲骨卜辞文字往往被大量的点状噪声、片状斑纹和固有纹理所污染。显然,ICDAR数据集既不能胜任甲骨卜辞文字检测的训练任务,又无法为甲骨卜辞文字自动检测提供一个标准的测试平台。

综上所述,基于计算机视觉的甲骨文字检测领域仍然面临图像数据集匮乏且标注困难的问题,尚缺少能反映真实甲骨拓片图像的文字、噪声和固有纹理的特点,构建效率高、具备自动标注能力或者对标注人员的知识技能依赖程度低、标注精度高,尤其是可扩展能力强的面向甲骨文字检测的图像数据集构建方法。

发明内容

本发明是为了解决现有技术所存在的上述技术问题,提供一种可有效解决甲骨卜辞拓片图像数据集有限、甲骨文字检测数据集匮乏且标注困难的问题,能反映真实甲骨拓片图像的文字、噪声和固有纹理的特点,构建效率高、可扩展能力强、具备自动标注能力、标注精度高、形态学先验约束的面向甲骨文字检测的图像数据集构建方法。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于辽宁师范大学,未经辽宁师范大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202110822165.7/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top