[发明专利]文本提取方法、装置及存储介质有效
申请号: | 201810857110.8 | 申请日: | 2018-07-31 |
公开(公告)号: | CN110163051B | 公开(公告)日: | 2023-03-10 |
发明(设计)人: | 李洋 | 申请(专利权)人: | 腾讯科技(深圳)有限公司 |
主分类号: | G06V20/40 | 分类号: | G06V20/40;G06V30/19 |
代理公司: | 深圳翼盛智成知识产权事务所(普通合伙) 44300 | 代理人: | 黄威 |
地址: | 518057 广东省深圳*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 文本 提取 方法 装置 存储 介质 | ||
1.一种文本提取方法,其特征在于,包括:
对视频进行解析,得到所述视频所包含的视频帧;
对所述视频帧进行文本提取处理,得到所述视频的初始文本集;所述初始文本集包括至少一个视频帧对应的初始文本;
获取所述初始文本集中初始文本之间的文本相似度;
根据所述文本相似度,对所述初始文本集中的初始文本进行优化处理,得到有效文本集;所述有效文本集包括至少一个有效文本;
按序将所述有效文本集中的有效文本,两两组合为文本对;
判断所述文本对中是否包括分割文本对;所述分割文本对内的有效文本之间不存在相同字段;
若存在,则基于所述分割文本对,将所述有效文本集划分为至少两个场景文本组;所述场景文本组内有效文本组成的文本对连续、且不包括分割文本对;
将各场景文本组中所有有效文本进行并集运算,得到各场景文本组对应的场景文本;
将所有场景文本组对应的场景文本,组合得到所述有效文本集对应的文本;
将所述有效文本集对应的文本,作为所述视频对应的视频文本。
2.根据权利要求1所述的文本提取方法,其特征在于,所述根据所述文本相似度,对所述初始文本集中的初始文本进行优化处理,得到有效文本集的步骤包括:
对文本相似度不低于第一阈值的初始文本,进行去重处理;
对文本相似度大于第二阈值、且小于第一阈值的初始文本,进行修正处理。
3.根据权利要求2所述的文本提取方法,其特征在于,所述对文本相似度大于第二阈值、且小于第一阈值的初始文本,进行修正处理的步骤包括:
将文本相似度大于第二阈值、且小于第一阈值的初始文本,作为待修正文本组;
获取待修正文本组中各字段的出现概率;
根据各字段的出现概率,确定所述待修正文本组对应的修正文本;
使用所述修正文本,替换所述待修正文本组内的初始文本。
4.根据权利要求1所述的文本提取方法,其特征在于,在将所有场景文本组对应的场景文本,组合得到所述有效文本集对应的文本的步骤之后,还包括:
获取各场景文本组中指定位置的有效文本所对应的视频帧在所述视频中的位置属性;
根据位置属性,确定所述场景文本组对应的标记符;
使用场景文本组对应的标记符,在所述有效文本集对应的文本中,对场景文本进行标记。
5.根据权利要求1至4任一项所述的文本提取方法,其特征在于,所述对所述视频帧进行文本提取处理,得到所述视频的初始文本集的步骤包括:
对所述视频所包含的视频帧进行筛选,得到有效视频帧;
对所述有效视频帧进行文本提取,生成所述视频的初始文本集。
6.根据权利要求5所述的文本提取方法,其特征在于,所述对所述视频所包含的视频帧进行筛选,得到有效视频帧的步骤包括:
检测拍摄所述视频时是否存在拍摄场景的切换操作;
若存在切换操作,则确定切换操作对应的切换视频帧;
将所述视频所包含的视频帧,剔除所述切换视频帧后,记为所述有效视频帧。
7.根据权利要求5所述的文本提取方法,其特征在于,所述对所述视频所包含的视频帧进行筛选,得到有效视频帧的步骤包括:
检测拍摄所述视频时是否存在抖动操作;
若存在抖动作,则确定抖动操作对应的抖动视频帧;
将所述视频所包含的视频帧,剔除所述抖动视频帧后,记为所述有效视频帧。
8.根据权利要求5所述的文本提取方法,其特征在于,所述对所述视频所包含的视频帧进行筛选,得到有效视频帧的步骤包括:
判断所述视频所包含的各视频帧是否存在文本;
将所述视频所包含的、存在文本的视频帧,记为所述有效视频帧。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于腾讯科技(深圳)有限公司,未经腾讯科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810857110.8/1.html,转载请声明来源钻瓜专利网。