[发明专利]一种端到端的集装箱号码识别方法及系统在审

申请号：	202211530371.1	申请日：	2022-11-30
公开（公告）号：	CN115937862A	公开（公告）日：	2023-04-07
发明（设计）人：	赖剑煌;陈泓栩;卢知之;谢晓华	申请（专利权）人：	中山大学
主分类号：	G06V30/148	分类号：	G06V30/148;G06V30/18;G06V30/19
代理公司：	深圳市创富知识产权代理有限公司 44367	代理人：	范伟民
地址：	510275 广东***	国省代码：	广东;44
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	一种端到端集装箱号码识别方法系统
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【说明书】：

本发明公开了一种端到端的集装箱号码识别方法及系统，该方法包括：将集装箱图片输入至预训练的识别模型；基于显著性前景感知网络对输入图片进行特征提取和分割；基于LSTM网络对文本显著性特征图进行字符增强；基于位置编码层对时间步长进行编码并输出查询向量；基于自注意力机制模型，以文本显著性特征图作为值输入、字符增强特征作为键输入、查询向量作为查询输入，输出特征向量；基于线性层对特征向量进行输出，得到识别结果。该系统包括：输入模块、显著性前景感知模块、字符特征增强模块、位置编码模块、自注意力机制模块和线性输出模块。通过使用本发明，能够准确定位并识别出集装箱号码和集装箱尺寸，可广泛应用于数据识别领域。

技术领域

本发明涉及数据识别领域，尤其涉及一种端到端的集装箱号码识别方法及系统。

背景技术

集装箱号码识别需要定位图片中关键文本的位置并进行相应的识别。对于现实生活中的场景，如果使用背景技术的方法对含有文本的图片进行处理，我们需要分两个阶段：第一个阶段是文本检测，定位图片中的文本位置；第二个阶段是文本识别，对第一个阶段得到的文本区域进行识别，这样需要分别训练两个模型，较为繁琐，而且错误的文本检测结果会进一步影响文本识别的结果，造成错误累积。目前针对横排的文本检测和识别方法已经较为成熟，而针对竖排文本、倾斜角度较大的文本以及在各种恶劣条件下(比如白雾，黑夜，雨天等)拍摄的文本的识别效果较差。在文本检测阶段，集装箱的拍摄图片上除了我们需要的集装箱号码信息，还有很多无关的信息，会干扰最后的结果；在文本识别阶段，现有大多数文字识别的方法大多数均利用上下文信息，严重依赖的上下文信息会导致注意力漂移问题，最后的识别结果较差。

发明内容

为了解决上述技术问题，本发明的目的是提供一种端到端的集装箱号码识别方法及系统，能够准确定位并识别出集装箱号码和集装箱尺寸。

本发明所采用的第一技术方案是：一种端到端的集装箱号码识别方法，包括以下步骤：

获取集装箱图片并将集装箱图片输入至预训练的识别模型；

基于显著性前景感知网络对输入图片进行特征提取和分割，得到文本显著性特征图；

基于LSTM网络对文本显著特征图进行字符增强，得到字符增强特征；

基于位置编码层对时间步长进行编码并输出查询向量；

基于自注意力机制模型，以文本显著性特征图作为值输入、字符增强特征作为键输入、查询向量作为查询输入，输出特征向量；

基于线性层对特征向量进行输出，得到识别结果。

进一步，还包括：

获取待测视频并对待测视频进行抽帧处理，得到集装箱图片。

进一步，所述基于显著性前景感知网络对输入图片进行特征提取和分割，得到文本显著性特征图这一步骤，其具体包括：