[发明专利]一种基于OCR的视频导图生成方法、装置、设备及存储介质有效
申请号: | 202110478515.2 | 申请日: | 2021-04-30 |
公开(公告)号: | CN112990142B | 公开(公告)日: | 2021-08-10 |
发明(设计)人: | 许丹 | 申请(专利权)人: | 平安科技(深圳)有限公司 |
主分类号: | G06K9/00 | 分类号: | G06K9/00;G06K9/20;G06K9/62;G06N3/08 |
代理公司: | 深圳市世联合知识产权代理有限公司 44385 | 代理人: | 汪琳琳 |
地址: | 518000 广东省深圳市福田区福*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 ocr 视频 生成 方法 装置 设备 存储 介质 | ||
本申请实施例属于人工智能中的图像处理技术领域,涉及一种基于OCR的视频导图生成方法。本申请还提供一种基于OCR的视频导图生成装置、计算机设备及存储介质。此外,本申请还涉及区块链技术,用户的原始视频数据可存储于区块链中。本申请由于该关键帧数据之间的关联关系是基于关键帧文本数据进行分析得到的,使得该关联关系可以有效帮助学习用户快速获知不同知识内容的关联性,有效提高用户记忆、理清思路和捕捉跳跃思考的能力,进而提高用户学习的效率。
技术领域
本申请涉及人工智能中的图像处理技术领域,尤其涉及一种基于OCR的视频导图生成方法、装置、计算机设备及存储介质。
背景技术
教学视频在某些领域,尤其企业培训中,已经逐渐变为和文字教材同等重要的学习媒介。视频相较文本让学生在学习时借助的感官更多,使学生获得更浓的学习兴趣,和更好的学习体验。在教学视频的基础上,利用思维导图学习该教学视频更是一种方便有效的学习方法,其具有方便记忆、擅长理清思路和捕捉跳跃思考的优势。以思维导图作为学习输出是加强课程理解的一种有效手段。
现有一种视频导图生成方法,通过截取原始视频的视频图像,并将该视频图像按照视频播放时间进行排序,得到一连串视频图像序列,从而视线视频导图的生成目的。
然而,传统的视频导图生成方法普遍不智能,仅仅依靠视频播放时间来建立不同视频图像的关联关系,导致不同视频图像之间的关联性较弱,从而弱化用户记忆、理清思路和捕捉跳跃思考的能力,进而降低用户学习的效率。
发明内容
本申请实施例的目的在于提出一种基于OCR的视频导图生成方法、装置、计算机设备及存储介质,以解决传统的视频导图生成方法降低用户学习效率的问题。
为了解决上述技术问题,本申请实施例提供一种基于OCR的视频导图生成方法,采用了如下所述的技术方案:
响应携带有原始视频数据的导图生成请求;
对所述原始视频数据进行关键帧提取操作,得到携带有视频时间信息的关键帧数据;
基于OCR技术以及所述视频时间信息的顺序依次对所述关键帧帧数据进行文本识别操作,得到关键帧文本数据;
基于所述关键帧文本数据中记载的文本内容确认各个所述关键帧数据之间的关键帧对应关系;
基于所述关键帧对应关系建立所述关键帧数据之间的关联关系,得到目标视频导图;
输出所述目标视频导图。
为了解决上述技术问题,本申请实施例还提供一种基于OCR的视频导图生成装置,采用了如下所述的技术方案:
请求响应模块,用于响应携带有原始视频数据的导图生成请求;
关键帧提取模块,用于对所述原始视频数据进行关键帧提取操作,得到携带有视频时间信息的关键帧数据;
文本识别模块,用于基于OCR技术以及所述视频时间信息的顺序依次对所述关键帧帧数据进行文本识别操作,得到关键帧文本数据;
对应关系获取模块,用于基于所述关键帧文本数据中记载的文本内容确认各个所述关键帧数据之间的关键帧对应关系;
导图获取模块,用于基于所述关键帧对应关系建立所述关键帧数据之间的关联关系,得到目标视频导图;
导图输出模块,用于输出所述目标视频导图。
为了解决上述技术问题,本申请实施例还提供一种计算机设备,采用了如下所述的技术方案:
包括存储器和处理器,所述存储器中存储有计算机可读指令,所述处理器执行所述计算机可读指令时实现如上所述的基于OCR的视频导图生成方法的步骤。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于平安科技(深圳)有限公司,未经平安科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110478515.2/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种输送装置
- 下一篇:一种对话处理方法、装置、电子设备及存储介质