[发明专利]基于百科知识语义增强的零样本分类方法、装置在审

申请号：	201710607191.1	申请日：	2017-07-24
公开（公告）号：	CN107292349A	公开（公告）日：	2017-10-24
发明（设计）人：	张俊格;谭铁牛;黄凯奇;贾真	申请（专利权）人：	中国科学院自动化研究所
主分类号：	G06K9/62	分类号：	G06K9/62
代理公司：	北京瀚仁知识产权代理事务所(普通合伙)11482	代理人：	郭文浩,王世超
地址：	100080 ***	国省代码：	北京;11
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	基于百科知识语义增强样本分类方法装置
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【说明书】：

技术领域

本发明涉及模式识别、机器学习、计算机视觉领域，特别涉及一种基于百科知识语义增强的零样本分类方法、装置。

背景技术

随着深度学习技术的发展和计算机运算能力的飞速提升，人工智能与计算机视觉等领域发展迅猛。作为其中最基本的任务，图像分类方法的性能也得到了极大的提高。图像分类任务要求计算机根据在训练数据集上学习到的先验知识，判别一张图片中物体的类别。传统的图像分类任务需要大量的、带有物体类别标注的训练图片。而收集带标注的训练图片需要耗费大量的时间，并且十分昂贵。零样本图像分类则希望通过在图像分类任务中引入辅助信息，帮助计算机视觉系统摆脱标注数据的桎梏，有能力对训练集中未出现类别的图像进行分类。

在图像分类任务中，模型在训练数据集上训练分类器参数，在测试数据集上测试学习得到的分类器性能。传统分类任务要求测试集图像类别完全包含于训练数据集。这给图像分类模型的实际应用带来诸多限制。首先，训练得到的模型只能在固定的分类空间中对测试图片进行分类，模型完全没有对新出现类别图片的分类能力。其次，要对所有类别收集大量带标签的训练图片，费时费力。在零样本图像分类任务着重希望解决传统图像分类问题存在的上述限制，使模型拥有对训练数据集中未出现类别图片的分类能力。与传统图像分类任务不同的是，零样本分类任务的训练集图像类别和测试集图像类别是完全不同的，测试集中的图像类别不出现在训练集中。通常将训练集中的图片类别称为已知类别(seen class)，测试集中的图片称为未知类别(unseen class)。由于未知类别的图像在训练集中并不出现，因此需要引入辅助信息(side information)来帮助模型学习未知类别的先验知识。通常使用的辅助信息有图像属性特征、文本描述和词向量(word vector)等。自2013年，词向量模型被提出后，这种无监督的特征学习方法为大多数零样本分类方法所采用。相较于属性特征和文本描述，词向量特征不需要特别进行人工标注，可以大规模、无监督地获取。词向量模型在大规模语料库上训练时，需要设定一个学习窗口，这个学习窗口通常较小(5～10)。较小的学习窗口可以使词向量模型高效地学习，但是也使学习得到的向量只能获得较小范围内的语义信息。即学习到的词向量缺少这种图像类别的全局信息，这对后续使用它们作为辅助信息进行零样本分类带来了较大弊端，影响了对未知类别的分类精度。

发明内容

为了解决现有技术中的上述问题，即为了解决现有零样本图像分类方法无法兼顾词向量语言信息范围与处理效率的问题，本发明的一方面，提出了一种基于百科知识语义增强的零样本分类方法，包括以下步骤：

步骤S1，将未知类别图像通过训练好的卷积神经网络分类器进行分类，根据分类概率，对分类结果标签的语义特征进行凸组合作为该未知类别图像的语义特征；

步骤S2，将步骤S1中得到的未知类别图像的语义特征与预先构建的语义特征空间中的语义特征，通过最近邻分类器进行分类，得到所述未知类别图像的最终分类；

其中，

所述训练好的卷积神经网络分类器，为通过已知类别图像的训练数据集进行分类训练后的卷积神经网络分类器；

所述预先构建的语义特征空间，其构建方法为：基于图像类别通过对应的百科词条信息，采用词频-逆文档频率算法提取关键词；基于各图像类别对应的关键词的权重对关键词的词向量进行凸组合，得到各图像类别对应图像的语义特征，各语义特征的集合构成了所述预先构建的语义特征空间；所述图像类别包括已知类别图像的类别标签、未知类别图像的类别标签；

步骤S1中所述分类结果标签的语义特征，为所述预先构建的语义特征空间中对应图像类别对应图像的语义特征。

优选地，所述预先构建的语义特征空间的构建过程中，所述各图像类别对应图像的语义特征，其计算方法为

其中，S(w)为图像类别w的语义特征，i_t为图像类别w的第t个关键词，s(i_t)为关键词i_t的词向量，W_TF-IDF(i_t)为关键词i_t的词频-逆文档频率权重，T为按照关键词的词频-逆文档频率权重降序选取的关键词的个数，为归一化因子。

优选地，步骤S1中未知类别图像的语义特征，其计算方法为

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于中国科学院自动化研究所，未经中国科学院自动化研究所许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/pat/books/201710607191.1/2.html，转载请声明来源钻瓜专利网。

上一篇：一种Bagging_BSJ短文本分类方法
下一篇：大规模数据的异常检测方法

同类专利

专利分类

G 物理

G06 计算；推算；计数
G06K 数据识别；数据表示；记录载体；记录载体的处理
G06K9-00 用于阅读或识别印刷或书写字符或者用于识别图形，例如，指纹的方法或装置
G06K9-03 .错误的检测或校正，例如，用重复扫描图形的方法
G06K9-18 .应用具有附加代码标记或含有代码标记的打印字符的，例如，由不同形状的各个笔画组成的，而且每个笔画表示不同的代码值的字符
G06K9-20 .图像捕获
G06K9-36 .图像预处理，即无须判定关于图像的同一性而进行的图像信息处理
G06K9-60 .图像捕获和多种预处理作用的组合

免登录下载普通用户下载升级VIP会员，免费下载

[发明专利]基于百科知识语义增强的零样本分类方法、装置在审

专利文献下载