[发明专利]支持模糊评论挖掘的视频高效检索系统在审

专利信息
申请号: 202110971077.3 申请日: 2021-08-23
公开(公告)号: CN113656641A 公开(公告)日: 2021-11-16
发明(设计)人: 严大莲;王华 申请(专利权)人: 严大莲
主分类号: G06F16/735 分类号: G06F16/735;G06F16/78;G06F16/35;G06F40/289;G06F16/951;G06F16/955;G06K9/62
代理公司: 暂无信息 代理人: 暂无信息
地址: 443100 湖*** 国省代码: 湖北;42
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 支持 模糊 评论 挖掘 视频 高效 检索系统
【说明书】:

发明提取视频的高层抽象概念,实现一套基于模糊评论挖掘的视频检索系统,通过编码网络蜘蛛收集各类视频的评论数据,解决针对各类视频的动态网页信息爬取问题,首先对评论数据进行清洗,然后采用关联规则挖掘算法,从评论中提取出频繁出现的名词集合,并通过孤立性和相关性剪枝去掉其中噪声集,为提高特征词与视频主题的相关性,采用点互信息对可能的非主题频繁词进行过滤,得到与视频密切的特征词集合,采用聚类算法对重复的表达进行聚类,提出基于信息群落将视频的可能相关内容对应到一系列的特征名词以及围绕每一个特征词的相关主题,通过LDA主题模型进行主题挖掘,基于Lucene开源检索框架实现,具有更高的准确性和效率。

技术领域

本发明涉及一种视频高效检索系统,特别涉及一种支持模糊评论挖掘的视频高效检索系统,属于视频模糊检索技术领域。

背景技术

伴随着移动智能设备的迅速普及,人们获取视频的方式也越来越便捷。网络视频的数量也开始爆炸式的增长。当前使用移动设备观看短视频的人也越来越多,面对互联网上的海量视频,快速准确的检索视频也成为一个研发重点。

目前,对于视频的检索分为两个方向:一是基于关键字的主题检索,本质上是文本检索,对于需要被检索的视频资料,首先需要人工对其进行标注,在具体的网页中,网页编辑对视频拟定标题,并加上相关描述,搜索引擎对视频所在页面的主题、标签及文本内容建立索引,当用户输入检索关键字后,搜索引擎对关键字进行解析并与索引库匹配,找出其中相匹配的项,并按照相关程度的强弱依次返回给用户;二是基于内容的视频检索,首先由检索系统通过对视频数据的底层视觉信息建立特征库,将视频的每帧数据按照一定的方式划分为镜头,由于视频的数据量过大,以镜头的方式进行查询仍然存在难度,所以需要对不同镜头提取出关键帧,最后将各个关键帧聚类为不同的场景,采用这种方式时,当需要对某个视频进行检索时,用户只需要向检索系统提交检索条件(图片或文本数据),检索系统通过分析并将其与索引进行匹配,找出其中近似的视频,然后按照近似程度依次呈现给用户。

为了达到对互联网海量视频数据中检索相关视频的目的,现有技术提出基于内容的思路,首先分析媒体数据中的视觉信息,提取相关特征并建立索引,然后按照一定的界面交互对媒体库进行检索,其中视频库主要用于存储要被检索的视频,而图像特征库则是对视频库内容和结构的描述,主要包括视觉特征、纹理、颜色和形状及运动信息和对象信息等,特征提取算法库主要用于对视频库的中视频进行特征提取的工具的集合,是视频检索系统的核心模块,检索系统则是用户接口,包含索引库,主要用于对特征建立索引,便于快速检索。很多知名企业和世界著名大学等科研机构都涉足这一领域,其中,QBIC是最早用于为俄罗斯博物馆保存的绘画作品进行查询,是最早被成功使用的基于内容的图像检索系统,除此之外,哥伦比亚大学开发的VideoQ系统在功能上更进一步,实现了对视频的检索,用户除了使用关键字查询来检索视频之外,还可以采用视频的低层视觉特征以及时空关系查询和检索所需视频。而同样由美国哥伦比亚大学研发的VisualSeek系统,在VideoQ的基础上,实现了对互联网上存储的多媒体信息的检索。美国麻省理工学院媒体研究室研发的PhotoBook系统则主要针对人脸图像,该系统通过提取人脸的视觉特征实现基于内容的检索。

现有技术的视频检索系统依然是基于关键字的检索系统,在此基础上,相关视频网站也做了改进,如视频分类系统的加入,以优酷为例,其视频大类分为:电视剧、电影、综艺、音乐、动漫5大类,在视频面向用户前,网站编辑会人工拟定一个标题并加上相关描述,按照类别的不同分属到不同的页面。当用户选择了他要检索的类别后,对视频的检索效率有提高。但在这样的分类体系中,一个视频的属性只能是一种,然而分类标准在对每个人存在差异性,单一的划分并不能满足所有人的要求,问题核心在于目前的检索系统都缺少检索对象与视频的高层抽象概念的理解,如视频表达的主题、包含的角色、阐述的理念、涉及的场景。虽然基于内容的视频检索系统对于视频进行了图像层面的理解,但这种理解如同对文章的单个字做了分析,对于高层抽象概念信息仍无法解读。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于严大莲,未经严大莲许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202110971077.3/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top