[发明专利]视频文本识别方法、装置、电子设备及可读存储介质有效
申请号: | 202210165002.0 | 申请日: | 2022-02-23 |
公开(公告)号: | CN114241471B | 公开(公告)日: | 2022-06-21 |
发明(设计)人: | 王章成;唐铭谦;王莽;赵永飞;马傲;徐良鹏 | 申请(专利权)人: | 阿里巴巴达摩院(杭州)科技有限公司 |
主分类号: | G06V20/62 | 分类号: | G06V20/62;G06V20/40;G06V30/146 |
代理公司: | 北京博雅睿泉专利代理事务所(特殊普通合伙) 11442 | 代理人: | 闫雪薇 |
地址: | 311100 浙江省杭州市余杭*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 视频 文本 识别 方法 装置 电子设备 可读 存储 介质 | ||
1.一种视频文本识别方法,其特征在于,包括:
获取待识别视频的轨迹信息;所述轨迹信息包括所述待识别视频中至少一个视频帧的同一文本检测区域对应的第一文本识别结果;将所述文本检测区域的位置信息相同的多个视频帧对应的第一文本识别结果确定为所述文本检测区域的轨迹信息;所述第一文本识别结果中至少包括第一文本识别内容和识别置信度;
对每个所述轨迹信息,根据所述识别置信度最高的第一文本识别内容,对所述识别置信度低于第一置信度阈值的第一文本识别内容进行第一纠错处理,得到至少一个所述视频帧的第二文本识别结果;所述第二文本识别结果包括经过第一纠错处理后的第一文本识别内容和对应的识别置信度;
根据至少一个所述视频帧的所述第二文本识别结果,获取所述待识别视频的关键词表;
根据所述关键词表,对至少一个所述视频帧中,经过第一纠错处理后的、识别置信度不符合第二置信度阈值的第一文本识别内容进行第二纠错处理,得到第二文本识别内容;
根据所述第二文本识别内容和经过第一纠错处理后的、所述识别置信度符合所述置信度阈值的第一文本识别内容,确定所述待识别视频的文本识别结果。
2.根据权利要求1所述的方法,其特征在于,所述获取待识别视频的轨迹信息,包括:
以设定帧率对所述待识别视频进行解帧,得到多个视频帧;
对每个所述视频帧,根据文本检测跟踪算法,得到所述视频帧的至少一个文本检测区域的位置信息;
根据文本识别算法对各所述文本检测区域的内容进行识别,得到所述第一文本识别内容及对应的识别置信度;
将所述第一文本识别内容和所述识别置信度确定为所述文本检测区域对应的第一文本识别结果;
将所述文本检测区域的位置信息相同的所述多个视频帧对应的第一文本识别结果确定为所述文本检测区域的轨迹信息。
3.根据权利要求1所述的方法,其特征在于,所述根据至少一个所述视频帧的所述第二文本识别结果,获取所述待识别视频的关键词表,包括:
筛选出至少一个所述视频帧中经过第一纠错处理后的、所述识别置信度高于所述第二置信度阈值的第一文本识别内容;
根据筛选后的所述第一文本识别内容和对应的文本检测区域,生成所述关键词表。
4.根据权利要求3所述的方法,其特征在于,所述筛选出至少一个所述视频帧中经过第一纠错处理后的、所述识别置信度高于所述第二置信度阈值的第一文本识别内容之后,所述方法还包括:
获取至少一个所述视频帧中经过第一纠错处理后的、与筛选后的所述第一文本识别内容对应的文本检测区域;
根据非极大值抑制算法对各所述视频帧的所述文本检测区域进行合并;
根据合并后的所述文本检测区域,以及对应的筛选后的所述第一文本识别内容,生成所述关键词表。
5.根据权利要求4所述的方法,其特征在于,所述根据非极大值抑制算法对各所述视频帧的所述文本检测区域进行合并之后,所述方法还包括:
统计所述文本检测区域中相同第一文本识别内容出现的次数;
根据出现的次数高于频次阈值的第一文本识别内容及对应的文本检测区域,生成所述关键词表。
6.根据权利要求4所述的方法,其特征在于,所述根据非极大值抑制算法对各所述视频帧的所述文本检测区域进行合并,包括:
将各所述视频帧中交并比高于交并比阈值的文本检测区域进行合并。
7.根据权利要求1所述的方法,其特征在于,所述根据所述关键词表,对至少一个所述视频帧中,经过第一纠错处理后的、识别置信度不符合第二置信度阈值的第一文本识别内容进行第二纠错处理,得到第二文本识别内容,包括:
根据所述关键词表,对至少一个所述视频帧中,经过第一纠错处理后的、识别置信度低于所述第二置信度阈值的第一文本识别内容进行匹配,在所述第一文本识别内容与所述关键词表的内容不一致的情况下,使用所述关键词表的内容替换所述第一文本识别内容,得到所述第二文本识别内容。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于阿里巴巴达摩院(杭州)科技有限公司,未经阿里巴巴达摩院(杭州)科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210165002.0/1.html,转载请声明来源钻瓜专利网。