|
钻瓜专利网为您找到相关结果 647个,建议您 升级VIP下载更多相关专利
- [发明专利]一种场景文字识别方法及系统-CN202210164606.3在审
-
邱明;许全星
-
厦门大学
-
2022-02-23
-
2022-05-27
-
G06V20/62
- 本发明公开了一种场景文字识别方法及系统。该方法包括:构建训练样本;训练样本包括公用数据集和非公用数据集;公用数据集和非公用数据集均包括场景图片和标签文件;通过训练样本训练Yolov5模型,得到字符检测模型;字符检测模型的输入为场景图片,输出为场景图片中包含的所有单个字符;通过训练样本和字符检测模型识别出的所有单个字符对Textformer模型进行训练;通过训练好的Textformer模型对待识别的场景图片中的文字区域和单个字符进行识别。本发明仅利用“Transoformer”就实现了一个端到端的文本定位器,相较于传统的使用卷积神经网络提取图片特征再输入到“Transformer”中的方法,有着更高的效率。并且,由于只用到了“Transformer”,所以本发明的模型框架更简单。
- 一种场景文字识别方法系统
|