[发明专利]一种基于SAS的图书借阅数据关联规则分析方法在审
申请号: | 201611014422.X | 申请日: | 2016-11-17 |
公开(公告)号: | CN106649583A | 公开(公告)日: | 2017-05-10 |
发明(设计)人: | 王学杰;李永刚;汪征;刘树峰 | 申请(专利权)人: | 安徽华博胜讯信息科技股份有限公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 北京和信华成知识产权代理事务所(普通合伙)11390 | 代理人: | 胡剑辉 |
地址: | 230000 安徽省合肥市高新区*** | 国省代码: | 安徽;34 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 sas 图书 借阅 数据 关联 规则 分析 方法 | ||
技术领域
本发明涉及信息管理技术领域,特别是涉及一种基于SAS的图书借阅数据关联规则分析方法。
背景技术
数据挖掘(Data Mining),又称为数据库中的知识发现(KDD)。数据挖掘技术从二十世纪年代开始受到多方面的青睐,其主要原因是因为计算机技术尤其是数据库管理方面的技术很复杂棘手,数据库中的数据增长很快,使得手动查找信息变得非常困难。数据挖掘技术对于发现和描述关系表中的隐藏模式非常有用,而且数据挖掘提供的算法允许自动模式查找。数据挖掘技术现己广泛应用于电信、电子商务及市场管理方面,大大提高了其管理效率、服务水平和经济效益。
高校数字图书馆随着信息资源的日益丰富、计算机技术运用到日常管理工作中,数据也正在以几何倍数增长同时在处理数据时也暴露出一些问题:
1.在馆藏建设过程中,图书采购目的模糊、针对性不强,常常带有个人的爱好取向,不能反映学校的学科建设方向和发展目标。
2.资源利用率低,检索不精确,不能在有效的时间内取得有效的信息,存在大量的冗余信息。
3.在大多数情况下,当前数据库中的信息由于不能方便地访问、分析,因而没有得到足够的重视或者没有充分使用。
4.一些数据库增长得太快,以至于即使系统管理员也经常不清楚系统中哪些信息可以用于当前需要处理的主要问题,以及系统中的数据与当前问题之间的关系。
5.信息开发利用不足对于海量数据只作一般性维护,没有进一步对其进行开发利用对于网上信息资源,没有进行甄别、筛选和重组,造成信息资源的浪费对于电子文献资源,二次开发不够等等。
以上出现的这些问题,为数据挖掘技术在高校数字图书馆中的应用提供了可能性而数据挖掘技术的日益成熟及数据挖掘产品的日益完善为数据挖掘技术在高校数字图书馆的信息资源管理中应用提供了可行性。
运用数据挖掘技术,有如下优点:
采用数据挖掘技术如聚类、关联规则等,可以对借阅流通记录、数字资源使用数据进行挖掘,发现隐藏的某种联系,得出图书文献借阅趋势、文献的利用率及读者的喜好参数,为图书采购、文献资料的增减提供决策依据,为学科建设提供信息说明和支撑同时也可为读者提供个性化信息服务,提高服务质量。
采用数据挖掘技术如聚类,找出馆内资源的相互关系,即通过聚类确定数据间存在的相似性,具有最相似性的数据聚集成簇并对这些数据进行整合。加强对各种非结构化的数据库如文本数据、图形数据、视频图像数据、声音数据、综合多媒体数据的整合,可丰富信息资源,提高资源的利用率、检索的精确性。
发明内容
本发明的目的是提供一种基于SAS的图书借阅数据关联规则分析方法。
本发明的目的可以通过以下技术方案实现:
一种基于SAS的图书借阅数据关联规则分析方法,包括:
步骤一、将从图书管理系统中导出的数据以文本方式保存后导入到数据库中,通过查询语句进行数据转换、合并、筛选,去除图书馆业务数据中与数据挖掘不相关的冗余项,保存与数据挖掘相关的重要属性;
步骤二、从数据库中提取数据,将从数据库中提取的数据以文本方式保存,然后导入EXCEL表并保存到读者借阅数据预处理文件夹中,对读者证号、索书号数据进行预处理,得到预处理后的读者证号、索书号数据表;
步骤三、将经过预处理的图书借阅数据导入SAS的数据库,进行有关的关联规则挖掘,从而得到关联规则挖掘结果;
步骤四、要对数据集中的索取号进行抽样,抽样方式为聚类并指定聚类数为13,运行后生成样本数据;
步骤五、选择SAS的ASSOCIATION分析模式,设置规则最小支持度,特别指定10%为最小支持度;
步骤六、设置一条关联规则中包含的最大项数,特别指定规则的最大项数为4;
步骤七、设置规则的最小置信度,特别指定规则的最小置信度为10%;
步骤八、对样本数据进行关联规则分析并获得关联规则;
步骤九、对于不符合条件“支持度>=10%和置信度>=60%”的规则删除掉,得到预期结果。
本发明的有益效果:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于安徽华博胜讯信息科技股份有限公司,未经安徽华博胜讯信息科技股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201611014422.X/2.html,转载请声明来源钻瓜专利网。
- 上一篇:推荐方法及装置
- 下一篇:一种主从式数据库系统中的索引处理方法和装置