[发明专利]基于主题模型方法和领域规则库实现场景分析描述的方法有效
申请号: | 201410057882.5 | 申请日: | 2014-02-20 |
公开(公告)号: | CN103778443B | 公开(公告)日: | 2017-05-03 |
发明(设计)人: | 何莹;王建;谭懿先;梅林;吴轶轩;杜欢;尚岩峰;王文斐;钟雪霞 | 申请(专利权)人: | 公安部第三研究所 |
主分类号: | G06K9/64 | 分类号: | G06K9/64;G06F17/30;G06F17/27 |
代理公司: | 上海智信专利代理有限公司31002 | 代理人: | 王洁,郑暄 |
地址: | 200031*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 主题 模型 方法 领域 规则 实现 场景 分析 描述 | ||
技术领域
本发明涉及计算机视觉分析与智能理解技术领域,尤其涉及基于主题模型方法和领域规则库对图像场景进行描述和高层理解领域,具体是指一种基于主题模型方法和领域规则库实现场景分析描述的方法。
背景技术
场景分类作为计算机视觉领域中图像分析理解技术的重要组成部分,其目标在于基于输入图像得到符合人类普遍认知的宏观语义信息。图像分类即是建立底层视觉特征(如颜色、边缘、纹理等)与高层语义概念之间的联系,最终得到场景的类别描述信息,如森林、海岸、篮球场等。目前,常见的场景分类方法有两种,分别为基于图像底层特征的方法和通过构建中间语义层的方法。所谓基于图像底层特征的方法,是利用图像的底层特征,如颜色、纹理和边缘特征等,将图像作为一个整体,应用监督学习方法,对场景进行分类,如室内/室外、森林/街道等场景图像,然而,该类方法只能对小部分的场景进行分类,有一定的局限性。此外,该类方法存在的另外一个主要问题为,底层物理特征通常只能反映图像在物理感知层面的特点,而非人们所关注的认知层面的理解。第二种方法通过构建中间语义层,能够实现更多场景类别的识别,如引入文本分析中的概率隐含语义分析模型,建立图像模型。然而这类方法仅仅是对场景进行了分类,没有涉及到对场景的分析,以及兴趣度事件的挖掘,而本发明即是在另外一种主题模型方法狄利克雷分布的基础上,引入领域知识库,除了进行场景分类外,亦对场景中存在的典型兴趣度事件进行挖掘。从对视觉理解的角度看,场景的分析和描述和场景中包含的对象有着极大的关系,如场景中存在人、足球、网,则最有可能的场景是足球场。
吴玲达等在其申请的发明专利“一种基于区域潜在语义特征的自然场景图像分类方法”[200810031577.3]中公开了一种基于区域潜在语义特征的自然场景分类方法。利用图像的区域潜在语义信息和该信息在空间的分布规律来进行自然场景图像分类。提出的方法引入了区域潜在语义特征,不仅描述了图像分块的区域信息,而且还对分块在空间的分布信息进行了描述,该方法可以得到较高的准确率,且不需要人工标注,自动化程度高。
戴琼海等在其申请的发明专利“基于谱图聚类分析的图像集合的场景分类方法及装置”[201110221407.3]中公开了一种基于谱图分析的图像结合的场景分类方法及装置,该方法通过交互时间确定的隶属度更加精确,避免非线性数据的丢失,进而提高分类结果的准确性,同时,该发明的装置结构简单,易于实现。
金标等在其申请的发明专利“一种基于目标及其空间关系特性的图像场景分类方法”[201110214985.4]中公开了一种基于目标及其空间关系特性的图像场景分类方法,通过计算图像中目标之间的空间关系直方图,分类其空间关系,建立融合主题之间空间关系特性的概率隐含语义分析模型,最后,采用支持向量机方法对场景进行分类。该方法弥补了现有图像场景分类方法忽视图像中目标之间空间关系特性的缺陷,有效地提高了分类准确率。
综上可知,上述专利均从场景分类角度对图像进行了处理,对于图像中存在的对象和图像表述含义之间的关系未进行关注,对图像所蕴含潜在的语义信息未能进行深度及有效挖掘。
发明内容
本发明的目的是克服了上述现有技术的缺点,提供了一种能够实现基于主题模型对场景进行分类的基础上引入领域规则库对场景进行潜在语义信息的挖掘、对兴趣度事件进行挖掘描述、具有良好的目的导向性和扩展性、简单有效、适用于大规模推广应用的基于主题模型方法和领域规则库实现场景分析描述的方法。
为了实现上述目的,本发明的基于主题模型方法和领域规则库实现场景分析描述的方法具有如下构成:
该基于主题模型方法和领域规则库实现场景分析描述的方法,其主要特点是,所述的方法包括以下步骤:
(1)获取训练视频图像并采用对象分类器对训练视频图像进行训练得到滴状对象容器和纹理对象容器;
(2)将所述的滴状对象容器和纹理对象容器进行融合并对融合的对象容器进行分析得到语义主题模型;
(3)获取测试视频图像并根据所述的语义主题模型对所述的测试视频图像进行场景分类得到场景分类结果;
(4)根据所述的语义主题模型的场景分类结果和基于先验知识建立的领域规则库对所述的测试视频图像进行场景语义理解描述。
较佳地,所述的采用对象分类器对训练视频图像进行训练得到滴状对象容器和纹理对象容器,包括以下步骤:
(11)对所述的训练视频图像采用尺度不变特征转换特征提取方法进行处理得到特征矩阵;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于公安部第三研究所,未经公安部第三研究所许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201410057882.5/2.html,转载请声明来源钻瓜专利网。