[发明专利]基于OCR技术的文字清晰度转化方法、系统、终端及介质在审
| 申请号: | 202111450118.0 | 申请日: | 2021-11-30 |
| 公开(公告)号: | CN114220109A | 公开(公告)日: | 2022-03-22 |
| 发明(设计)人: | 汪媛 | 申请(专利权)人: | 越读(浙江)数字科技有限公司 |
| 主分类号: | G06V30/41 | 分类号: | G06V30/41;G06V30/148;G06V30/19;G06V10/74;G06K9/62 |
| 代理公司: | 暂无信息 | 代理人: | 暂无信息 |
| 地址: | 312000 浙江省*** | 国省代码: | 浙江;33 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 基于 ocr 技术 文字 清晰度 转化 方法 系统 终端 介质 | ||
本申请涉及基于OCR技术的文字清晰度转化方法、系统、终端及介质,其包括获取古文字图像;依据古文字图像生成字符参数;依据字符参数确定各个字符的识别区域;识别各个识别区域,生成对应各个字符的形状特征;将字符的形状特征与预设的古文字数据库对比,确定古文字字体样式;依据所属古文字字体样式及古文字数据库识别字符的形状特征,查找对应的高清字符模型并依据高清字符模型生成高清字符;依据原有字符编排顺序编排所有高清字符;执行校对操作,依据校对结果调整高清字符;输出显示有高清字符的高清图像。本申请具有提升古文字的辨识度,方便读者进行阅读、临摹和学习古文字的效果。
技术领域
本申请涉及文字转化技术的领域,尤其是涉及一种基于OCR技术的文字清晰度转化方法、系统、终端及介质。
背景技术
OCR (Optical Character Recognition,光学字符识别)是一项用于检查纸上打印的字符或图片上的字符,并通过检测暗、亮色差的模式确定字符形状,辅以字符识别方法,将形状翻译成计算机文字的技术,广泛应用于文字转化的软硬件中。
由于古文字种类繁多、字符抽象、词义生涩,因此不适合初学者直接进行阅读和理解。初学者或普通读者想要理解古代书籍的内容,需要翻阅相应的词典或请教专业的老师进行逐字翻译才能理解,流程较为复杂,耗费时间较长。
目前也存在一些程序,存储有各个朝代的古文字,可通过形状特征对比的方式查找到与古文字释义一致的现代汉语,以此对古文字进行翻译,将古文字转化为现代汉字。
针对上述中的相关技术,发明人认为若读者直接阅读古文字原文,则难以辨认一些字体偏门或者因侵蚀现象出现字体残缺的古文字,而现有的直接将古文字翻译为现代汉语的方式虽然可以方便读者理解文章的内容,但对于学者而言,历史还原度低,失去了学习古文字本身的过程,存在缺乏学习、教育意义的缺陷。
发明内容
第一方面,为了提升古文字的辨识度,方便读者进行阅读、临摹和学习古文字,本申请提供一种基于OCR技术的文字清晰度转化方法。
本申请提供的一种基于OCR技术的文字清晰度转化方法,采用如下的技术方案:
一种基于OCR技术的文字清晰度转化方法,包括:
获取古文字图像;
依据古文字图像生成字符参数;
依据字符参数确定各个字符的识别区域;
识别各个识别区域,生成对应各个字符的形状特征;
将字符的形状特征与预设的古文字数据库对比,确定古文字字体样式;
依据所属古文字字体样式及古文字数据库识别字符的形状特征,查找对应的高清字符模型并依据高清字符模型生成高清字符;
依据原有字符编排顺序编排所有高清字符;
执行校对操作,依据校对结果调整高清字符;
输出显示有高清字符的高清图像。
通过采用上述技术方案,先确定字符参数,以此得到字符的识别区域,方便进行识别;之后依据字符的形状特征在预设的古文字数据库内查找相似字体的高清字符模型,确定全篇的古文字字体样式,缩小查找范围;最后在确定的查找范围内查找到对应的高清字符模型并生成高清字符;通过校对操作筛选出识别错误的字符进行重新调整,最终得到转化成高清字符的高清图像,降低古文字辨认难度,方便读者进行阅读、临摹和学习古文字。
优选的,所述字符参数包括字符尺寸、字符行间距;
所述字符参数的生成方法包括:
获取并对古文字图像执行图像二值化处理,生成二值图像;
依据二值图像区分字符区与间隙区;
筛选出间隙区内形成的闭合环状图形;
依据所有闭合环状图形的尺寸,计算并生成字符参数。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于越读(浙江)数字科技有限公司,未经越读(浙江)数字科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111450118.0/2.html,转载请声明来源钻瓜专利网。





