[发明专利]基于OCR和双向LSTM的文字序列纠错算法、系统及其设备在审
申请号: | 201710630581.0 | 申请日: | 2017-07-28 |
公开(公告)号: | CN107463928A | 公开(公告)日: | 2017-12-12 |
发明(设计)人: | 王志成;邝展豪;高磊;刘志欣;王亮 | 申请(专利权)人: | 顺丰科技有限公司 |
主分类号: | G06K9/03 | 分类号: | G06K9/03;G06K9/32 |
代理公司: | 北京志霖恒远知识产权代理事务所(普通合伙)11435 | 代理人: | 崔静 |
地址: | 518061 广东省深圳市南山区学府路(以南)*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 ocr 双向 lstm 文字 序列 纠错 算法 系统 及其 设备 | ||
1.基于OCR和双向LSTM的文字序列纠错算法,适用于图像中文字的识别,其特征在于,包括步骤:
S1,获取文字图像;
S2,所述文字图像经过OCR预处理得到第一序列集合X={x0,x1,...,xm};
S3,将正序的{x0,x1,…,xm}以及反序的{xm,xm-1,...,x0}输入双向LSTM构建的编码器中得到语境向量c;
S4,所述语境向量c经双向LSTM构建的解码器解码分别获得第二序列集合Y。
2.根据权利要求1所述的基于OCR和双向LSTM的文字序列纠错算法,其特征在于,步骤S3中所述的语境向量c为:
c=Φ({h1,h2,…,hTS});
ht=f(xt,ht-1)。
3.根据权利要求1所述的基于OCR和双向LSTM的文字序列纠错算法,其特征在于,步骤S4中所述的第二序列集合Y为:
Y=(y0,y1,…,yn);
st=f(yt-1,st-1,c);
p(yt|y<t,X)=g(yt-1,st,c)。
4.根据权利要求2或3所述的基于OCR和双向LSTM的文字序列纠错算法,其特征在于,步骤S1中所述的文字图像为快递单图像。
5.根据权利要求2或3所述的基于OCR和双向LSTM的文字序列纠错算法,其特征在于,步骤S2中所述的OCR预处理的阈值为系统允许的最低reliability阈值。
6.基于OCR和双向LSTM的文字序列纠错系统,其特征在于,包括:
图像采集模块,用于获取文字图像;
OCR处理模块,用于对所述文字图像进行OCR预处理得到第一序列集合X={x0,x1,...,xm};
双向LSTM构建的编码器,用于对正序的{x0,x1,…,xm}以及反序的{xm,xm-1,...,x0}进行编码得到语境向量c;
双向LSTM构建的解码器,用于对所述语境向量c进行解码分别获得第二序列集合Y。
7.基于OCR和双向LSTM的文字序列纠错设备,包括存储有计算机程序的计算机可读介质,其特征在于,所述程序被运行用于执行:
S1,获取文字图像;
S2,所述文字图像经过OCR预处理得到第一序列集合X={x0,x1,...,xm};
S3,将正序的{x0,x1,…,xm}以及反序的{xm,xm-1,...,x0}输入双向LSTM构建的编码器中得到语境向量c;
S4,所述语境向量c经双向LSTM构建的解码器解码分别获得第二序列集合Y。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于顺丰科技有限公司,未经顺丰科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710630581.0/1.html,转载请声明来源钻瓜专利网。