[发明专利]一种长文本资料的文本识别方法有效
| 申请号: | 202210245889.4 | 申请日: | 2022-03-14 |
| 公开(公告)号: | CN114359889B | 公开(公告)日: | 2022-06-21 |
| 发明(设计)人: | 杜博文 | 申请(专利权)人: | 北京智源人工智能研究院 |
| 主分类号: | G06V20/62 | 分类号: | G06V20/62;G06V10/24;G06V30/12;G06N3/04;G06N3/08 |
| 代理公司: | 北京动力号知识产权代理有限公司 11775 | 代理人: | 梁艳 |
| 地址: | 100084 北京市海淀区*** | 国省代码: | 北京;11 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | 本发明公开了一种长文本资料的文本识别方法,包括:获取长文本资料的待检测图像;使用用于检测长文本的场景文字检测模型对所述待检测图像中的文本进行文本框检测,获取多个预测点及各预测点对应的文本框;根据各个所述文本框内的文本行识别所述待检测图像的扭曲状态是否超过预设状态,若是,则对该待检测图像进行扭曲矫正;对扭曲矫正后的待检测图像进行文本识别。解决了长文本图像文本检测效果差的问题,而且实现了对扭曲文本的检测和矫正,很好的适应了复杂场景下图像的文本检测,并保证和提高了文本检测的准确度,为实现准确的文本识别奠定了基础;适应了对用户不专业拍摄生成的图像进行文本检测的场景,提高了用户的使用体验,易于推广应用。 | ||
| 搜索关键词: | 一种 文本 资料 识别 方法 | ||
【主权项】:
暂无信息
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京智源人工智能研究院,未经北京智源人工智能研究院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/202210245889.4/,转载请声明来源钻瓜专利网。





