[发明专利]文字识别方法、电子设备、存储介质有效
申请号: | 201810884966.4 | 申请日: | 2018-08-06 |
公开(公告)号: | CN109101973B | 公开(公告)日: | 2019-12-10 |
发明(设计)人: | 张恒;李铭瀚;于刚;方建华 | 申请(专利权)人: | 掌阅科技股份有限公司 |
主分类号: | G06K9/34 | 分类号: | G06K9/34;G06K9/62 |
代理公司: | 11276 北京市浩天知识产权代理事务所(普通合伙) | 代理人: | 宋菲;赵娅 |
地址: | 100124 北*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开了一种文字识别方法、电子设备、存储介质,其方法包括:获取包含第一文字的图片;提取图片中第一文字的笔画信息;根据笔画信息,获取第一文字的线段数据集;将第一文字的线段数据集与预设数据库中的多个文字的线段数据集进行比对,查找与第一文字的线段数据集的重合度大于预设阈值的预设数据库中的第二文字,作为第一文字的识别结果。提取第一文字的笔画信息,将图片文字拆分为具体的直线信息或曲线信息,得到第一文字具体的线段数据集,实现将文字转化为数据集。通过将第一文字的线段数据集与预设数据库中的线段数据集比对,计算数据集间的重合度,直观的根据数据信息,得到的第一文字的识别结果更加准确,提高文字识别率。 | ||
搜索关键词: | 线段数据 预设 笔画信息 文字识别 存储介质 电子设备 数据库 重合度 比对 计算数据 曲线信息 数据信息 图片文字 文字转化 直线信息 数据集 直观 查找 图片 | ||
【主权项】:
1.一种文字识别方法,其包括:/n获取包含第一文字的图片;/n提取所述图片中第一文字各笔画对应的线条,根据提取的线条得到对应的笔画信息,所述笔画信息包含直线信息和曲线信息;/n根据所述直线信息,获取包含直线的端点位置信息和倾斜角度信息的第一线段数据子集;根据所述曲线信息,将对应的曲线进行拟合处理,得到多个线段,根据多个线段获取包含各个线段的端点位置信息和倾斜角度信息的第二线段数据子集;/n将所述第一线段数据子集和所述第二线段数据子集进行合并得到所述第一文字的线段数据集;/n查找预设数据库中与所述第一文字的线段数据集中线段个数相同,且根据端点位置信息和/或倾斜角度信息计算得到的重合度大于预设阈值的预设数据库中的第二文字,作为所述第一文字的识别结果。/n
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于掌阅科技股份有限公司,未经掌阅科技股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201810884966.4/,转载请声明来源钻瓜专利网。