[发明专利]一种数据处理的方法和装置有效
申请号: | 201511030144.2 | 申请日: | 2015-12-31 |
公开(公告)号: | CN106933886B | 公开(公告)日: | 2020-12-18 |
发明(设计)人: | 林浚玮;肖磊;王巨宏;陈伟;李霆 | 申请(专利权)人: | 哈尔滨工业大学深圳研究生院;腾讯科技(深圳)有限公司 |
主分类号: | G06F16/2458 | 分类号: | G06F16/2458 |
代理公司: | 北京三高永信知识产权代理有限责任公司 11138 | 代理人: | 刘映东 |
地址: | 518055 广东*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 数据处理 方法 装置 | ||
本发明公开了一种数据处理的方法和装置,属于计算机技术领域。所述方法包括:获取样本数据记录,根据每条样本数据记录中的参数项和对应的参数值,以及预设的隶属度函数,确定每个参数值对应的参数值等级和参数值等级的权值,并根据每条样本数据记录中各参数值等级的权值,选取样本总权值大于预设阈值的参数值等级;根据在每条样本数据记录中所述选取的参数值等级对应的权值,确定满足预设组合条件的参数值等级,分别基于每个满足预设组合条件的参数值等级,确定参数值等级组合;确定每个所述参数值等级组合对应的样本总权值,输出样本总权值大于预设阈值的参数值等级组合。采用本发明,可以节约处理资源。
技术领域
本发明涉及计算机技术领域,特别涉及一种处理数据的方法和装置。
背景技术
随着信息技术的发展,数据挖掘的应用越来越广泛。在数据挖掘中,模糊频繁项目集挖掘算法是一种常用的算法。通过模糊频繁项目集挖掘算法,计算机可以确定数据样本中出现频率较高的参数项,以及参数项的组合。采用模糊频繁项目集挖掘算法进行数据挖掘时,计算机可以先获取数据样本,数据样本可以包括多条样本数据记录,每条样本数据记录中可以包括至少一个参数项,以及每个参数项对应的参数值。计算机中可以存储预先定义的隶属度函数,隶属度函数中可以预先设置一个或多个参数值等级,以及各参数值等级对应的预设阈值,对于任一参数项的参数值,计算机中可以根据隶属度函数,确定该参数值对应各阈值的权值,然后可以将该参数值用预先设置的参数值等级和参数值等级对应的权值进行表示。例如,参数项为温度,参数值为25,参数值等级为温度高、温度中、温度低,对应的预设阈值依次为10、20、30,则可以根据隶属度函数确定该参数值对应高等级的权值为0.5,该参数值对应中等级的权值为0.5,该参数值对应低等级的权值为0。计算机可以将上述样本数据记录中的各参数项的参数值,用参数值等级和对应的权值进行表示,例如,参数项为温度,参数值为25,可以表示为0.5/温度高,0.5/温度中。这样,计算机可以得到各参数项、参数值等级和权值的对应关系表。
对于任一参数项,计算机可以在每条样本数据记录中,获取该参数项对应各参数值等级的权值,分别计算各参数值等级对应的权值的和值(即样本总权值),确定对应的样本总权值最大的参数值等级,作为该参数项对应的参数值等级。这样,计算机可以确定各参数项对应的参数值等级,然后可以获取样本总权值大于预设阈值的参数值等级。计算机可以将获取到的参数值等级进行任意组合,得到多个参数值等级组合。对于任一参数值等级组合,计算机可以在上述对应关系表中,查询包含该参数值等级组合的样本数据记录,并可以在每条样本数据记录中,获取该参数值等级组合包含的参数值等级对应的权值,进而获取其中最小的权值,计算机可以将各样本数据记录中获取到的最小的权值进行相加,得到参数值等级组合对应的样本总权值。计算机可以在多个参数值等级组合中,确定对应的样本总权值大于预设阈值的参数值等级组合,得到出现频率较高的参数值等级组合。
在实现本发明的过程中,发明人发现现有技术至少存在以下问题:
对于每个参数值等级组合,计算机都需要按照上述处理方式在上述对应关系表中进行一次查找,从而确定该参数值等级组合是否为频率较高的参数值等级组合,这样会占用计算机大量的处理资源。
发明内容
为了解决现有技术的问题,本发明实施例提供了一种数据处理的方法和装置。所述技术方案如下:
第一方面,提供了一种数据处理的方法,所述方法包括:
获取样本数据记录,每条样本数据记录包括至少一个参数项,以及每个参数项对应的参数值;
根据每条样本数据记录中的参数项和对应的参数值,以及预设的隶属度函数,确定每个参数值对应的参数值等级和参数值等级的权值,并根据每条样本数据记录中各参数值等级的权值,选取样本总权值大于预设阈值的参数值等级;
根据在每条样本数据记录中所述选取的参数值等级对应的权值,确定满足预设组合条件的参数值等级,分别基于每个满足预设组合条件的参数值等级,确定参数值等级组合;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于哈尔滨工业大学深圳研究生院;腾讯科技(深圳)有限公司,未经哈尔滨工业大学深圳研究生院;腾讯科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201511030144.2/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种全自动智能细胞培养装置
- 下一篇:一种全自动智能细胞培养装置