[发明专利]用于呈现数据的方法和装置有效
申请号: | 201310104829.1 | 申请日: | 2013-03-28 |
公开(公告)号: | CN104077303B | 公开(公告)日: | 2017-07-28 |
发明(设计)人: | 张超;严骏驰;王瑜;赵乾坤;张欣;田春华 | 申请(专利权)人: | 国际商业机器公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30;G06N3/08 |
代理公司: | 北京市金杜律师事务所11256 | 代理人: | 酆迅,李峥宇 |
地址: | 美国纽*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 用于 呈现 数据 方法 装置 | ||
技术领域
本发明的各实施方式涉及数据处理,更具体地,涉及用于将高维数据转换为低维数据并以可视化方式进行呈现的方法和装置。
背景技术
随着计算机硬件技术以及软件技术的发展,越来越多的行业已经实现了基于计算机的自动化处理。随着办公自动化的普及,业务处理期间涉及的各种数据可以以诸如二维表格等方式存储在数据存储系统中。通常,根据行业的不同,这些数据通常会涉及方方面面的数据,并且以相当高的维度表示。
具体地,仅以电子产品行业为例,当电子产品提供商建立数据库时,需要采集关于客户的诸多方面的信息。在本发明的上下文中,可以将这些方面称为“维度”。例如,在描述客户属性时,可以包括但不限于如下维度,姓名、年龄、血型、职业、婚姻状况、收入等方面的信息;例如,对于出售的各种商品而言,可能会涉及商品名称、型号、价格、折扣、销量、生产日期、保修期等方面的信息。当记录购买事件的内容时,则需要包括客户属性、商品属性以及购买发生的时间、地点等等更多维度。在上文中仅以示例方式示出了数据中可能涉及的多个维度的示例,应当理解,在实际应用环境中,数据的维度可能会达到数十甚至上百的数量级。
目前的常规处理是,以二维表格的形式将数据的各个维度打印在诸如纸张上或者在显示器上显示。当数据维度较低(例如,小于5维)时,可以较为方便地以二维表格形式呈现,然而当数据的维度达到一定数量级时,根本不能以常规方式来呈现这些数据。
数据立方体技术是数据处理领域中的一种新型的技术方案,立方体可以以更为直观的方式存储和显示多维数据。该技术方案可以将高维的原始数据转换为三维数据并进行显示。目前,如何基于数据立方体技术来以更有效的方式将高维数据转换为低维数据,并进行可视化显示已经成为一个研究重点。
尽管目前已经开发出一些基于数据立方体技术来对降低数据维度的技术方案,然而实现这些技术方案的基础是,假定待处理数据可以全面地反映所在领域的数据分布规律,即,只有当待处理数据能够展示原始数据在整个样本空间内的常规分布规律时,才能够准确地降低这些待处理数据的维度。
然而目前所面临的问题在于,在许多领域中实现办公自动化的时间并不长,所采集到的原始数据在数量上并不充分,并且有可能不能够全面反映该领域中的一般分布规律。例如,仅以电子产品行业为例,电子产品在A国还属于新兴行业,并且根据目前在A国市场中所采集到的数据,客户可能主要集中在20-40岁的年龄段;然而根据发达国家的统计数据,电子产品的主要客户可能会集中在例如15-50岁的年龄区间。
应当注意,待处理数据本身会随着时间而逐渐丰富,并且逐渐趋向于反映数据自身的真实分布规律,如果在初始时基于所采集到的“非典型”数据来开发数据立方体模型,则很可能会因为该数据模型不够准确等原因,造成该数据模型不再适用于处理未来的数据,甚至造成必须放弃已经付出劳动并重新构造数据模型等不良结果。另一方面,新兴行业中的技术人员的专业素质有待提高,无法以有效的方式处理数据。因而,面对从不成熟数据源采集到的并不能准确反映数据的一般分布规律的原始数据,如何以适当方式进行处理成为一项亟待解决的问题。
发明内容
因而,期望开发出一种数据转换的技术方案,期望该技术方案能够对来自不成熟数据源的原始数据进行合理处理,进而将该原始数据从复杂的高维数据转换为较低维度的数据,并且还期望可以以易于识别的方式向用户呈现该数据的可视化表现。
在本发明的一个实施方式中,提供了一种用于呈现数据的方法,包括:从数据源的第一数据集合获取第一原始数据、以及转换自第一原始数据的第一三维数据;提取将第一原始数据转换为第一三维数据的转换规则;响应于从数据源的第二数据集合获取第二原始数据,基于转换规则将第二原始数据转换为第二三维数据;以及呈现第二三维数据的可视化表示;其中第一原始数据和第二原始数据的维度大于三维。
在本发明的一个实施方式中,呈现第二三维数据的可视化表示包括:根据第二三维数据的三个维度,将第二三维数据划分为多个空间;以及在第二三维数据的三个维度中呈现多个空间。
在本发明的一个实施方式中,在第二三维数据的三个维度中呈现多个空间包括:将多个空间之一内的一部分第二三维数据聚类为多个类别;以及在空间内呈现多个类别。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于国际商业机器公司,未经国际商业机器公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201310104829.1/2.html,转载请声明来源钻瓜专利网。
- 上一篇:基于云端的学习系统及其方法
- 下一篇:一种从文档集中抽取热词短语的方法和装置
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置