[发明专利]基于高斯混合模型聚类算法的分层级数据可视化方法有效
申请号: | 202110388631.5 | 申请日: | 2021-04-12 |
公开(公告)号: | CN113010615B | 公开(公告)日: | 2021-10-01 |
发明(设计)人: | 毕家泽;张平哲;陈祎琼;高羽佳;刘澳;张玮 | 申请(专利权)人: | 安徽农业大学 |
主分类号: | G06F16/28 | 分类号: | G06F16/28;G06F16/215;G06F16/25 |
代理公司: | 合肥中谷知识产权代理事务所(普通合伙) 34146 | 代理人: | 洪玲 |
地址: | 230000 *** | 国省代码: | 安徽;34 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 混合 模型 算法 层级 数据 可视化 方法 | ||
本发明涉及一种基于高斯混合模型聚类算法的分层级数据可视化方法,包括以下步骤:在网页中接收用户上传的数据文件储存至后台数据库,并统一文件格式;对统一文件格式后的数据进行分析、清洗预处理,得到待聚类数据;利用高斯混合模型将待聚类数据进行首次聚类和次级聚类,得到待展示数据;建立前端页面,利用虚拟滚动技术将待展示数据进行分层级可视化展示。本发明利用序号标记基因节点的想法,设计了一种对于关系型基因数据聚类的处理方法,采用分层级显示数据,并且只加载当前层级数据进行显示,根据聚类算法将数据划分成了许多类,这样大大减少一个页面显示的数据量,方便人们观察。
技术领域
本发明属于数据可视化领域,具体涉及一种基于高斯混合模型聚类算法的分层级数据可视化方法。
背景技术
在生物信息学中分析、收集遗传等数据后,大多都需进行数据的可视化。随着B/S架构的飞速发展以及多数使用者的认可,使得将数据通过前端页面进行展示的方法也广泛应用于生物信息方面。在生物信息中基因与基因之间进行节点关系可视化中,多用Echarts的关系图以及其他开源的可视化库,引用到前端页面,实现B/S架构为基础的数据可视化的过程。
但是该种数据可视化技术还存在以下问题:
1.信息分析后产生的数据量较为庞大,在利用一些开源可视化库的“力导向图”模块或“关系图”模块的过程中,会因为数据量过大导致网页渲染极其缓慢,最后导致浏览器崩溃,网页无响应。具体的在前端页面中显示“力导向图”时,当导入的数据量大于一个阈值时(对于不同的硬件设备运行,阈值也有所不同;此处说明的是市面上普遍的、适中的硬件设备运行),Html页面需要渲染,由于数据过多导致加载过慢,从而使网页无响应,最后数据可视化失败。
2.市面上可使用的开源可视化工具中的“力导向图”模块或“关系图”模块,展示的效果在一些需要查看节点与节点之间“链接线”的长度时并不是很好,再加上大部分的线条会重叠,类似于“毛球”,想要通过人工精准找到两个节点之间的关系链接线条难度极大,给人们在这方面的可观察性大大降低。另外若针对某一个节点,有很多数据节点链接,由于不同数据节点之间的联系程度(节点距离)不同,再考虑到一些必要的参数的设置,例如节点与节点间斥力参数的设定等,则会在一个正常的显示页面中显示内容不全,如图6(此处为导入500个数据节点显示效果)。
3.当需要数据量达到一定程度,并传给前端进行可视化的时候,大多数工程师会采用“懒加载(懒渲染)”的方法。即每次渲染一部分数据,并监听窗口的滚动,当某个设定的元素展示后,将加载下一部分数据。这种方式的弊端在于,当用户滑动窗口次数过多,由于页面将加载数据而没有数据释放,页面会愈加卡顿,直到某批数据的加入依旧会引起页面崩溃。
4.虚拟滚动技术在大数据量的数据可视化中也有广泛的应用。首先,虚拟滚动技术并不适合“力导向图”或“关系图”此类数据展示方式;其次,虚拟滚动技术是一次性加载全部数据,然后对可见范围内的数据进行渲染。但由于大数据分析等方向所传输的数据量极大,导致当一次性加载全部数据时也会引起页面的一些延时问题。
在生物信息的这个方向中,当利用机器学习等计算机算法得出一些数据后,需进行数据展示,从而进行人为的数据利用与筛选。但到目前为止,市面上还没有一个较好的、可利用的、大数据量的数据可视化方法。
发明内容
本发明的目的就在于为了解决上述问题而提供一种较好的、可利用的、大数据量的一种基于高斯混合模型聚类算法的分层级数据可视化方法。
本发明通过以下技术方案来实现上述目的:
一种基于高斯混合模型聚类算法的分层级数据可视化方法,包括以下步骤:
S1、在网页中接收用户上传的数据文件储存至后台数据库,并统一文件格式;
S2、对统一文件格式后的数据进行分析、清洗预处理,得到待聚类数据;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于安徽农业大学,未经安徽农业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110388631.5/2.html,转载请声明来源钻瓜专利网。