[发明专利]文件分类方法及文件分类器无效
申请号: | 200710099404.0 | 申请日: | 2007-05-18 |
公开(公告)号: | CN101051322A | 公开(公告)日: | 2007-10-10 |
发明(设计)人: | 占文静;游明琦 | 申请(专利权)人: | 北京中星微电子有限公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 北京德琦知识产权代理有限公司 | 代理人: | 王一斌;王琦 |
地址: | 100083北京市*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 文件 分类 方法 | ||
技术领域
本发明涉及文件分类技术,特别涉及文件分类方法及文件分类器。
背景技术
传统的文件分类方法通常是按照文件的扩展名进行文件分类,即:将扩展名作为分类特征,根据待分类文件的扩展名将具有相同扩展名的所有文件归为一类。这种文件分类方法是一种粗分类,而实际应用中通常需要更为精细的分类,因此,采用该文件分类方法所区分出的类别在很多情况下都不能满足实际应用的要求。并且,该方法要求所有待分类文件均具有扩展名,如果某文件没有扩展名,则该方法无法对该文件进行分类。
针对上述传统方法提出的一种改进的方法是:根据实际应用中对分类精细度的要求制定分类层次和与每个分类层次对应的分类特征,通过编程一层一层地实现符合该分类层次要求和分类特征要求的文件分类。
这里,分类特征是指:能够表征某文件某种格式特性的指标,是对文件进行分类时所依据的文件特性,例如,扩展名、声道数、压缩格式等均可以作为分类特征。对于“扩展名”这一分类特征,其取值可以是wave、bmp、mp3等,“声道数”这一分类特征的取值可以是单声道和双声道,“压缩格式”这一分类特征的取值可以是微软的脉冲编码调制(PCM_MS)、微软的自适应音频脉冲编码调制(ADPCM_MS)等。
采用上述方法可以根据实际应用的需要,从待分类文件中分出符合分类特征取值要求的文件。但是,该方法存在分类层次固定、分类特征固定、分类方式不灵活、可扩展性差的缺陷。例如,若已实现将wave文件按声道数进行分类,进一步想再按压缩格式或位宽进行随意分类时,或想在按压缩格式分类后再按声道数进行分类时,就需要专门的开发人员对源代码进行大量的修改才能实现。因为,原有源代码的执行过程是:首先根据文件扩展名这一分类特征区分出扩展名取值为wave的文件,然后根据声道数这一分类特征将符合声道数取值要求的文件区分出来。而当我们想在此之后进一步按压缩格式取值或位宽取值进行随意分类时,就需要增加相应的源代码。并且,该方法也要求待分类文件具有扩展名。
由上述分析可见,现有文件分类方法分类层次固定、分类特征固定,导致其不能按照不同的应用要求进行文件分类,可扩展性差。并且,不能对没有扩展名的文件进行分类,分类精确度不高。
发明内容
有鉴于此,本发明的主要目的在于提供一种文件分类方法,以实现灵活、精确的文件分类。
本发明的另一个主要目的在于提供一种文件分类器,以实现灵活、精确的文件分类。
为达到上述目的,本发明的技术方案具体是这样实现的:
一种文件分类方法,包括以下步骤:
设置至少一个分类特征,得到所述分类特征取值的所有组合;
对待分类文件的位流进行分析,得到所述待分类文件的分类特征取值的组合;
根据所述分类特征取值的所有组合,和所述待分类文件的分类特征取值的组合,确定所述待分类文件的类别。
进一步地,可以设置至少一个分析规则,所述每一个分析规则用于对符合同一个分类特征的待分类文件的位流进行分析;
所述对待分类文件的位流进行分析为:依次调用所述分析规则对待分类文件的位流进行分析。
进一步地,可以设置调用指示,所述调用指示用于确定所调用的分析规则;
在所述依次调用分析规则之前,进一步判断是否已设置所述调用指示,若已设置,则调用与所述调用指示对应的分析规则对待分类文件的位流进行分析;否则,继续执行依次调用分析规则的操作。
在所述依次调用分析规则之前,可以进一步判断设置分析规则所依据的分类特征中,是否存在与所述待分类文件的分类特征相符的分类特征;
如果存在,则调用所述相符的分类特征所对应的分析规则分析待分类文件的位流;否则,继续执行依次调用分析规则的操作。
在得到所述分类特征取值的所有组合之后,可以进一步设置所述分类特征取值的所有组合与类别标识的对应关系;
所述确定所述待分类文件的类别为:根据所述分类特征取值的所有组合与类别标识的对应关系,和所述待分类文件的分类特征取值的组合,确定所述待分类文件的类别标识。
进一步地,可以设置与所述分类特征对应的分类层次;
所述分类特征取值的所有组合中取值的排列顺序、以及所述待分类文件的分类特征取值的组合中取值的排列顺序符合所述分类层次的排列顺序。
进一步地,可以为每个类别设置符合所述分类层次的排列顺序的分类目录;
在确定待分类文件的类别之后,进一步将所述待分类文件存入与所述类别相应的分类目录中。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京中星微电子有限公司,未经北京中星微电子有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/200710099404.0/2.html,转载请声明来源钻瓜专利网。