[发明专利]一种语种识别方法、装置、电子设备及存储介质有效

申请号：	201811543890.5	申请日：	2018-12-17
公开（公告）号：	CN111339787B	公开（公告）日：	2023-09-19
发明（设计）人：	张雪雷;沈海峰;苟巍	申请（专利权）人：	北京嘀嘀无限科技发展有限公司
主分类号：	G06V30/246	分类号：	G06V30/246;G06V30/41;G06V30/19
代理公司：	北京超成律师事务所 11646	代理人：	邓超
地址：	100193 北京***	国省代码：	北京;11
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	一种语种识别方法装置电子设备存储介质
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【说明书】：

本申请涉及计算机视觉技术领域，尤其涉及一种语种识别方法、装置、电子设备及存储介质，其中，该方法包括：获取目标文本图像，其中，所述目标文本图像中携带有目标文本；将所述目标文本图像划分为多个目标文本子图像；根据所述目标文本图像、所述多个目标文本子图像、以及预先训练的语种识别模型，确定与所述目标文本对应的语种。采用上述方案，利用训练出的语种识别模型直接对文本图像进行语种识别，使得识别效率和识别准确率较高，适用性较强。

技术领域

本申请涉及计算机视觉技术领域，具体而言，涉及一种语种识别方法、装置、电子设备及存储介质。

背景技术

在世界范围内，不同国家的人使用不同种类的语言，相应地，文字也各不相同。因此，在自然场景图像中的文字所属的语种(如中文、英文、阿拉伯文等)也千差万别。为了解决语种和文字之间的障碍，光学文字识别(Optical Character Recognition，OCR)技术应运而生，且得到了广泛的应用。

在相关技术中，当需要识别图像中的文字信息时，通常需要先在图像中确定出文字行，然后使用OCR技术识别文字行中的文字信息。

然而，现有的OCR技术均需要假定文字所属的语种已知，也即，在基于OCR技术进行文字识别时，均需要预先指定待识别文字的语种。因此，当语种未知或指定错误时，OCR的识别效果较差，且通常需要针对不同的语种设计专门的OCR系统，适用性较差。

可见，目前尚缺乏识别图像中的文本语种的方案。

发明内容

有鉴于此，本申请实施例的目的在于提供一种语种识别方法、装置、电子设备及存储介质，能够基于文字图像进行语种识别，识别准确率较高。

主要包括以下几个方面：

第一方面，本申请实施例提供了一种语种识别方法，所述方法包括：

获取目标文本图像，其中，所述目标文本图像中携带有目标文本；