[发明专利]视频文本识别方法、装置、电子设备及可读存储介质有效
申请号: | 202210165002.0 | 申请日: | 2022-02-23 |
公开(公告)号: | CN114241471B | 公开(公告)日: | 2022-06-21 |
发明(设计)人: | 王章成;唐铭谦;王莽;赵永飞;马傲;徐良鹏 | 申请(专利权)人: | 阿里巴巴达摩院(杭州)科技有限公司 |
主分类号: | G06V20/62 | 分类号: | G06V20/62;G06V20/40;G06V30/146 |
代理公司: | 北京博雅睿泉专利代理事务所(特殊普通合伙) 11442 | 代理人: | 闫雪薇 |
地址: | 311100 浙江省杭州市余杭*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 视频 文本 识别 方法 装置 电子设备 可读 存储 介质 | ||
本公开实施例提出了一种视频文本识别方法、装置、电子设备及可读存储介质。该方法包括:获取待识别视频的轨迹信息;轨迹信息包括待识别视频中至少一个视频帧的同一文本检测区域对应的第一文本识别结果;对每个轨迹信息,根据识别置信度最高的第一文本识别内容,对识别置信度低于第一置信度阈值的第一文本识别内容进行第一纠错处理,得到至少一个视频帧的第二文本识别结果;根据第二文本识别结果,经过第一纠错处理后的识别置信度不符合第二置信度阈值的第一文本识别内容进行第二纠错处理,得到第二文本识别内容;根据第二文本识别内容和经过第一纠错处理后的识别置信度符合所述置信度阈值的第一文本识别内容,确定待识别视频的文本识别结果。
技术领域
本公开实施例涉及视频识别技术领域,更具体的,涉及一种视频文本识别方法、装置、电子设备及可读存储介质。
背景技术
视频文本识别可以识别视频中的文字信息,可应用于各类视频场景中,有效区分文字内容是否合规,降低违规风险。
相关技术中,视频文字识别的实现,通常先通过文本检测模型识别出视频帧中可能存在文本的区域,再利用文本识别模型对该可能存在文本的区域进行识别,获取到文本识别结果。
但是,在视频的清晰度不足、背景复杂等的情况下,文本检测模型容易出现漏检误检的情况,从而导致文本识别模型出现误识别,使得视频文字识别结果的准确度较低。
发明内容
本公开实施例提供一种视频文本识别方法,可以提高视频文字识别结果的准确度。
根据本公开的第一方面,提供了一种视频文本识别方法,包括:
获取待识别视频的轨迹信息;所述轨迹信息包括所述待识别视频中至少一个视频帧的同一文本检测区域对应的第一文本识别结果;所述第一文本识别结果中至少包括第一文本识别内容和识别置信度;
对每个所述轨迹信息,根据所述识别置信度最高的第一文本识别内容,对所述识别置信度低于第一置信度阈值的第一文本识别内容进行第一纠错处理,得到至少一个所述视频帧的第二文本识别结果;所述第二文本识别结果包括经过第一纠错处理后的第一文本识别内容和对应的识别置信度;
根据至少一个所述视频帧的所述第二文本识别结果,获取所述待识别视频的关键词表;
根据所述关键词表,对至少一个所述视频帧中,经过第一纠错处理后的、所述识别置信度不符合第二置信度阈值的第一文本识别内容进行第二纠错处理,得到第二文本识别内容;
根据所述第二文本识别内容和经过第一纠错处理后的、所述识别置信度符合所述第二置信度阈值的第一文本识别内容,确定所述待识别视频的文本识别结果。
可选地,所述获取待识别视频的轨迹信息,包括:
以设定帧率对所述待识别视频进行解帧,得到多个视频帧;
对每个所述视频帧,根据文本检测跟踪算法,得到所述视频帧的至少一个文本检测区域的位置信息;
根据文本识别算法对各所述文本检测区域的内容进行识别,得到所述第一文本识别内容及对应的识别置信度;
将所述第一文本识别内容和所述识别置信度确定为所述文本检测区域对应的第一文本识别结果;
将所述文本检测区域的位置信息相同的所述多个视频帧对应的第一文本识别结果确定为所述文本检测区域的轨迹信息。
可选地,所述根据至少一个所述视频帧的所述第二文本识别结果,获取所述待识别视频的关键词表,包括:
筛选出至少一个所述视频帧中经过第一纠错处理后的、所述识别置信度高于所述第二置信度阈值的第一文本识别内容;
根据筛选后的所述第一文本识别内容和对应的文本检测区域,生成所述关键词表。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于阿里巴巴达摩院(杭州)科技有限公司,未经阿里巴巴达摩院(杭州)科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210165002.0/2.html,转载请声明来源钻瓜专利网。