[发明专利]一种文本定位方法和装置在审

申请号：	202010147332.8	申请日：	2020-03-05
公开（公告）号：	CN112749606A	公开（公告）日：	2021-05-04
发明（设计）人：	郑岩	申请（专利权）人：	腾讯科技（深圳）有限公司
主分类号：	G06K9/00	分类号：	G06K9/00;G06K9/20;G06K9/34;G06K9/46;G06K9/62
代理公司：	深圳翼盛智成知识产权事务所(普通合伙) 44300	代理人：	汪阮磊
地址：	518057 广东省深圳***	国省代码：	广东;44
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	一种文本定位方法装置
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【说明书】：

本申请实施例公开了一种文本定位方法和装置；本申请实施例可以获取文本图像；对文本图像进行字符轮廓提取，得到文本图像中字符的字符轮廓信息；根据字符轮廓信息，从文本图像中确定字符所在的字符区域；对字符区域进行分类，得到字符区域的字符类别；根据字符区域的字符类别，对字符区域进行区域合并，得到每种字符类别对应的目标字符区域。该方案能够基于字符的字符轮廓信息确定字符所在的字符区域，并对字符区域进行分类以及区域合并，使得合并后得到的每种字符类别对应的目标字符区域更加准确，从而大大提高了文本定位的准确度。

技术领域

本发明涉及人工智能技术领域，具体涉及一种文本定位方法和装置。

背景技术

随着人工智能的到来，文本识别作为该领域的重要应用，愈发收到重视。如今，数字文档由最初的纯文本文档过渡到文本图片混排、手写印刷体混排、多语言和多字体的文档混排等。以生活中应用较多的手写和印刷体混排文本为例，文本中的手写和印刷体文本都各自发挥着应有的作用，因此将手写和印刷文本进行区分和定位，是非常有意义的，也有助于后续更加针对性的数据处理。

现有的文本定位方法，在文本分类过程中，多是针对单个文本行进行的印刷和手写文本的分类，在文本定位过程中，通常是基于空白模板对手写文本进行定位，即在定位过程中需要使用额外的模板信息用于特征配准。

在对现有技术的研究和实践过程中，本发明的发明人发现，现有技术难以在没有空白模板的情况下对手写文本进行定位，从而使得对文本定位的准确度大大降低。

发明内容

本申请实施例提供一种文本定位方法和装置，可以提高文本定位的准确度。

本申请实施例提供一种文本定位方法，包括：

获取文本图像；

对所述文本图像进行字符轮廓提取，得到所述文本图像中字符的字符轮廓信息；

根据所述字符轮廓信息，从所述文本图像中确定字符所在的字符区域；

对所述字符区域进行分类，得到所述字符区域的字符类别；

根据所述字符区域的字符类别，对所述字符区域进行区域合并，得到每种字符类别对应的目标字符区域。

相应的，本申请实施例还提供了一种文本定位装置，包括：

获取单元，用于获取文本图像；