[发明专利]文本重叠检测方法、装置、介质和电子设备在审
申请号: | 202211678556.7 | 申请日: | 2022-12-26 |
公开(公告)号: | CN115937864A | 公开(公告)日: | 2023-04-07 |
发明(设计)人: | 梁晓云;高永强;杨萍 | 申请(专利权)人: | 抖音视界有限公司 |
主分类号: | G06V30/148 | 分类号: | G06V30/148;G06V30/18;G06V30/19;G06V10/26;G06V10/44;G06V10/764;G06V10/82;G06N3/0464;G06N3/048;G06N3/08 |
代理公司: | 北京英创嘉友知识产权代理事务所(普通合伙) 11447 | 代理人: | 王修雨 |
地址: | 100041 北京市石景山区*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 文本 重叠 检测 方法 装置 介质 电子设备 | ||
本公开涉及一种文本重叠检测方法、装置、介质和电子设备,属于计算机技术领域,能够提高文本重叠检测的准确性和召回精度。一种文本重叠检测方法,包括:对待检测对象进行文字识别,得到待检测对象中、文本行的文字识别置信度,将文字识别置信度低于预设识别置信度阈值的文本行添加到第一候选异常区域集中;从待检测对象中截取待检测对象的各个文本行的文本行图像,对文本行图像进行文本分类,将文本分类结果为重叠文本的文本行添加到第二候选异常区域集中;对待检测对象中的重叠文本进行目标检测,将目标检测结果为重叠文本的文本行添加到第三候选异常区域集中;将第一、第二和第三候选异常区域集的交集确定为文本重叠检测结果。
技术领域
本公开涉及计算机技术领域,具体地,涉及一种文本重叠检测方法、装5置、介质和电子设备。
背景技术
任意应用程序中出现文本重叠的异常现象(如图1的文本重叠示意图所示),都会严重影响到用户体验,文本重叠严重时甚至会导致用户无法理解0页面信息。
因此,迫切需要一种智能的针对文本重叠的检测方案。
发明内容
提供该发明内容部分以便以简要的形式介绍构思,这些构思将在后面的5具体实施方式部分被详细描述。该发明内容部分并不旨在标识要求保护的技术方案的关键特征或必要特征,也不旨在用于限制所要求的保护的技术方案的范围。
第一方面,本公开提供一种文本重叠检测方法,包括:对待检测对象进行文字识别,得到所述待检测对象中、文本行的文字识别置信度,将所述文0字识别置信度低于预设识别置信度阈值的文本行添加到第一候选异常区域集中;从所述待检测对象中截取所述待检测对象的各个文本行的文本行图像,对所述文本行图像进行文本分类,将文本分类结果为重叠文本的文本行添加到第二候选异常区域集中;对所述待检测对象中的重叠文本进行目标检测,
将目标检测结果为重叠文本的文本行添加到第三候选异常区域集中;将所述5第一候选异常区域集、所述第二候选异常区域集和所述第三候选异常区域集的交集确定为文本重叠检测结果。
第二方面,本公开提供一种文本重叠检测装置,包括:文字识别模块,用于对待检测对象进行文字识别,得到所述待检测对象中、文本行的文字识别置信度,将所述文字识别置信度低于预设识别置信度阈值的文本行添加到第一候选异常区域集中;文本分类模块,用于从所述待检测对象中截取所述待检测对象的各个文本行的文本行图像,对所述文本行图像进行文本分类,将文本分类结果为重叠文本的文本行添加到第二候选异常区域集中;目标检测模块,用于对所述待检测对象中的重叠文本进行目标检测,将目标检测结果为重叠文本的文本行添加到第三候选异常区域集中;确定模块,用于将所述第一候选异常区域集、所述第二候选异常区域集和所述第三候选异常区域集的交集确定为文本重叠检测结果。
第三方面,本公开提供种计算机可读介质,其上存储有计算机程序,该程序被处理装置执行时实现本公开第一方面中任一项所述方法的步骤。
第四方面,本公开提供一种电子设备,包括:存储装置,其上存储有计算机程序;处理装置,用于执行所述存储装置中的所述计算机程序,以实现本公开第一方面中任一项所述方法的步骤。
通过采用上述技术方案,利用文字识别方式得到了待检测对象的第一候选异常区域集,利用文本分类方式得到了待检测对象的第二候选异常区域集,利用目标检测方式得到了待检测对象的第三候选异常区域集,并利用第一候选异常区域集、第二候选异常区域集和第三候选异常区域集的交集来确定文本重叠检测结果,由于在现实环境下,出现文本重叠的概率非常低,因此将上述三个候选异常区域集的交集作为最终的文本重叠检测结果,大大提高了文本重叠检测的准确性,提高了召回精度。另外,还大大减小了文本重叠检测的人力成本。
本公开的其他特征和优点将在随后的具体实施方式部分予以详细说明。
附图说明
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于抖音视界有限公司,未经抖音视界有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202211678556.7/2.html,转载请声明来源钻瓜专利网。