[发明专利]基于神经网络的分类方法、装置、终端及可读介质在审
申请号: | 201910251875.1 | 申请日: | 2019-03-29 |
公开(公告)号: | CN110070171A | 公开(公告)日: | 2019-07-30 |
发明(设计)人: | 周翊民;孙菁聪;庞昊然;胡静 | 申请(专利权)人: | 中国科学院深圳先进技术研究院 |
主分类号: | G06N3/02 | 分类号: | G06N3/02;G06N3/08;G06K9/62 |
代理公司: | 深圳中细软知识产权代理有限公司 44528 | 代理人: | 阎昱辰 |
地址: | 518000 广东省深圳市*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 多媒体文件 分类 竞争神经网络 分类结果 神经网络 自组织 备选 计算机可读介质 终端 分类效率 可读介质 目标分类 并行 输出 | ||
本发明实施例公开了一种基于神经网络的分类方法、装置、终端及计算机可读介质,其中,所述方法包括:获取待分类的多媒体文件;将所述待分类的多媒体文件分别输入多个并行的训练好的自组织竞争神经网络模型,获取所述多个自组织竞争神经网络模型输出的备选分类结果;根据所述备选分类结果,确定与所述待分类的多媒体文件对应的目标分类结果。采用本发明实施例,可提高多媒体文件分类的准确性和分类效率。
技术领域
本发明涉及机器学习技术领域,具体涉及一种基于神经网络的分类方法、装置、终端及计算机可读介质。
背景技术
在现有的机器学习算法中,可以通过机器学习对各类数据进行标注和分类,例如,可以有监督的神经网络模型或者其他分类器来对数据进行分类。但是,在上述分类方法中,首先需要人为创建标签,需要花费大量的标注成本,因此,在对无标签的多任务分类问题中,多采用无监督的机器学习算法。无监督学习直接从数据本身得到数据的性质,然后总结数据或对数据进行分组分类;也就是说,上述数据本身的性质可用于数据驱动的决策。但是,无监督方法的分类能力较弱,尤其是针对相似程度较高的图像、音频、视频等多媒体文件之间,其出错率较高。
也就是说,在对图像、音频、视频等无标签的多媒体文件进行分类时,无监督学习算法的分类能力较弱,存在分类的准确性不足的问题。
发明内容
基于此,在本实施例中,提出了一种基于神经网络的分类方法、装置、终端及计算机可读介质,可以对图像、音频、视频等多媒体文件进行分类,且不需要事先进行标注,提高了多媒体文件分类的准确性和分类效率。
本发明解决上述技术问题的技术方案如下:
本发明第一方面提供一种基于神经网络的分类方法,包括:
获取待分类的多媒体文件;
将所述待分类的多媒体文件分别输入多个并行的训练好的自组织竞争神经网络模型,获取所述多个自组织竞争神经网络模型输出的备选分类结果;
根据所述备选分类结果,确定与所述待分类的多媒体文件对应的目标分类结果。
可选的,所述将所述待分类的多媒体文件分别输入多个自组织竞争神经网络模型,获取所述多个自组织竞争神经网络模型输出的子分类结果的步骤,还包括:
将所述待分类的多媒体文件输入所述自组织竞争神经网络模型,通过所述自组织竞争神经网络模型的第一级网络输出粗分类结果,通过所述自组织竞争神经网络模型的第二级网络输出细分类结果;
将所述细分类结果作为所述备选分类结果。
可选的,所述通过所述自组织竞争神经网络模型的第一层输出粗分类结果的步骤,还包括:
计算所述待分类的多媒体文件与所述自组织竞争神经网络模型的第一层网络包含的多个竞争神经元之间的距离值,根据所述计算得到的距离值确定所述粗分类结果;
所述通过所述自组织竞争神经网络模型的第二级网络输出细分类结果的步骤,还包括:
计算所述待分类的多媒体文件与所述自组织竞争神经网络模型的第二层网络包含的多个竞争神经元之间的距离值,根据所述计算得到的距离值和所述粗分类结果确定所述细分类结果。
可选的,所述根据所述备选分类结果,确定与所述待分类的多媒体文件对应的目标分类结果的步骤,还包括:
统计所述多个自组织神经网络模型输出的备选分类结果输出的备选分类结果的出现次数,确定出现次数最多的备份分类结果作为所述目标分类结果。
可选的,所述方法还包括:
获取用于训练的多媒体样本文件集,所述多媒体样本文件集包括多个多媒体样本文件;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国科学院深圳先进技术研究院,未经中国科学院深圳先进技术研究院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910251875.1/2.html,转载请声明来源钻瓜专利网。