[发明专利]一种基于OCR的视频导图生成方法、装置、设备及存储介质有效
申请号: | 202110478515.2 | 申请日: | 2021-04-30 |
公开(公告)号: | CN112990142B | 公开(公告)日: | 2021-08-10 |
发明(设计)人: | 许丹 | 申请(专利权)人: | 平安科技(深圳)有限公司 |
主分类号: | G06K9/00 | 分类号: | G06K9/00;G06K9/20;G06K9/62;G06N3/08 |
代理公司: | 深圳市世联合知识产权代理有限公司 44385 | 代理人: | 汪琳琳 |
地址: | 518000 广东省深圳市福田区福*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 ocr 视频 生成 方法 装置 设备 存储 介质 | ||
1.一种基于OCR的视频导图生成方法,其特征在于,包括下述步骤:
响应携带有原始视频数据的导图生成请求;
对所述原始视频数据进行关键帧提取操作,得到携带有视频时间信息的关键帧数据;
基于OCR技术以及所述视频时间信息的顺序依次对所述关键帧数据进行文本识别操作,得到关键帧文本数据;
基于所述关键帧文本数据中记载的文本内容确认各个所述关键帧数据之间的关键帧对应关系;
基于所述关键帧对应关系建立所述关键帧数据之间的关联关系,得到目标视频导图;
输出所述目标视频导图;
所述基于所述关键帧文本数据中记载的文本内容确认各个所述关键帧数据之间的关键帧对应关系的步骤,具体包括:
判断首个所述关键帧文本数据是否存在同类编号格式;
若首个所述关键帧文本数据不存在同类编号格式,则判断下一个所述关键帧文本数据是否存在同类编号格式;
若首个所述关键帧文本数据存在同类编号格式,则将所述同类编号格式确定为一级关联关系,并将与所述同类编号格式内容相对应的其他所述关键帧文本数据确定为同级关联关系;
当完成对最后一个所述关键帧文本数据的判断操作后,得到所述关键帧对应关系;
所述将所述同类编号格式确定为一级关联关系,并将与所述同类编号格式内容相对应的其他所述关键帧文本数据确定为同级关联关系的步骤,具体包括:
分别将所述其他关键帧文本数据输入至语义分析模型进行词义识别操作,得到真实词义信息;
判断所述真实词义信息与所述同类编号格式内容是否相同;
若所述真实词义信息与所述同类编号格式内容相同,则确认当前关键帧文本数据与所述首个关键帧文本数据存在关联关系;
若所述真实词义信息与所述同类编号格式内容不相同,则确认当前关键帧文本数据与所述首个关键帧文本数据不存在关联关系。
2.根据权利要求1所述的基于OCR的视频导图生成方法,其特征在于,所述对所述原始视频数据进行关键帧提取操作,得到携带有视频时间信息的关键帧数据的步骤,具体包括:
对所述原始视频数据进行视频帧提取操作,得到视频帧数据;
对所述视频帧数据进行截屏采样操作,得到视频图片序列;
对所述视频图片序列进行相似度比较并过滤相同图片,得到所述关键帧数据。
3.根据权利要求2所述的基于OCR的视频导图生成方法,其特征在于,所述对所述视频图片序列进行相似度比较并过滤相同图片,得到所述关键帧数据的步骤,具体包括:
依次对所述图片序列的相邻两张图片进行相似度比较操作,得到图片相似度;
判断所述图片相似度是否满足预设的相似度阈值;
若所述图片相似度满足预设的相似度阈值,则确认所述相邻两张图片画面相同;
若所述图片相似度不满足预设的相似度阈值,则确认所述相邻两张图片画面不相同,并将所述相邻两张图片的末置图片作为所述关键帧数据。
4.根据权利要求1所述的基于OCR的视频导图生成方法,其特征在于,在所述响应携带有原始视频数据的导图生成请求的步骤之后,还包括:
将所述原始视频数据存储至区块链中。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于平安科技(深圳)有限公司,未经平安科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110478515.2/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种输送装置
- 下一篇:一种对话处理方法、装置、电子设备及存储介质