[发明专利]一种基于生物数据的数据分析方法有效

申请号：	201811360788.1	申请日：	2018-11-15
公开（公告）号：	CN109597901B	公开（公告）日：	2021-11-16
发明（设计）人：	黄海辉;戴经国;梁勇;陈燕琴	申请（专利权）人：	韶关学院
主分类号：	G06F16/45	分类号：	G06F16/45;G06K9/62
代理公司：	广州三环专利商标代理有限公司 44202	代理人：	颜希文;麦小婵
地址：	512005 ***	国省代码：	广东;44
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	一种基于生物数据分析方法
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【权利要求书】：

1.一种基于生物数据的数据分析方法，其特征在于，包括：

建立数据格式池，将生物数据通过所述格式池进行过滤，剔除错误格式的生物数据；

获取生物数据，建立样本数据库；

对所述样本数据库中的生物数据进行特征提取处理，形成属性不同的若干个聚类，建立聚类库；

提取所述聚类库中的数据建立高维模型；

将需要进行实验的生物数据通过高维模型进行过滤，获得可行数据；

所述对所述样本数据库中的生物数据进行特征提取处理，形成属性不同的若干个聚类，建立聚类库，包括：

提取所述样本数据库中的生物数据，使用统计方法将各个生物数据进行分析提取概念关键词；

利用层次聚类算法计算所述概念词之间的相似度，使之聚成一类，形成具有等级关系的聚类；

建立聚类库，将形成的所有聚类储存在聚类库中。

2.如权利要求1所述的方法，其特征在于，所述统计方法包括：串频统计方法和信息熵统计方法。

3.如权利要求1所述的方法，其特征在于，所述利用层次聚类算法计算所述概念词之间的相似度，使之聚成一类，形成具有等级关系的聚类，包括：

将提取出来的每一个概念关键词单独列成一个类；

利用相似度算法计算类与类之间的相似度；

将计算出相似度大的类合并成一个聚类，直到所有单独列成的类完成合并；

对已经完成合并的聚类继续执行上述步骤，继续进行聚类间合并，直至形成一个具有等级关系的聚类。

4.如权利要求3所述的方法，其特征在于，所述相似度算法包括Dice系数和皮尔逊相关性公式。

5.如权利要求1所述的方法，其特征在于，所述提取所述聚类库中的数据建立高维模型，包括：

建立训练数据库和测试数据库，将聚类库中的数据分别储存到所述训练数据库和所述测试数据库；

建立高维模型，将所述训练数据库中数据传输到高维模型中进行训练；

数据训练完成后，将所述测试数据库中数据传输到高维模型中进行测试，获得经过优化处理后的高维模型。

6.如权利要求5所述的方法，其特征在于，所述将所述训练数据库中数据传输到高维模型中进行训练，还包括：当训练的次数达到训练阈值或训练的准确度达到预设的训练准确值后，停止训练；所述将所述测试数据库中数据传输到高维模型中进行测试，还包括：当测试的次数达到测试阈值或测试的准确度达到预设的测试准确值后，停止测试。

7.如权利要求6所述的方法，其特征在于，所述训练阈值为20万次，所述训练准确值为90％；所述测试阈值为20万次，所述测试准确值为90％。

8.如权利要求1所述的方法，其特征在于，所述数据格式池包括数字格式、图片格式、字符格式和算法字符。

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于韶关学院，未经韶关学院许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/pat/books/201811360788.1/1.html，转载请声明来源钻瓜专利网。

上一篇：本地和远程媒体项的管理
下一篇：图片审核方法、装置、设备及存储介质

同类专利

专利分类

G 物理

G06 计算；推算；计数
G06F 电数字数据处理

免登录下载普通用户下载升级VIP会员，免费下载

[发明专利]一种基于生物数据的数据分析方法有效

专利文献下载