[发明专利]一种医疗健康大数据的分类方法在审
申请号: | 201810511473.6 | 申请日: | 2018-05-24 |
公开(公告)号: | CN108710700A | 公开(公告)日: | 2018-10-26 |
发明(设计)人: | 文丹 | 申请(专利权)人: | 文丹 |
主分类号: | G06F17/30 | 分类号: | G06F17/30;G06F17/27 |
代理公司: | 北京盛凡智荣知识产权代理有限公司 11616 | 代理人: | 曾龙 |
地址: | 528429 广东省*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开了健康数据处理技术领域的一种医疗健康大数据的分类方法,该方法的具体步骤如下:S1:分类数据预处理;S2:数据的近邻分类;S3:特征选择:按照特征词的权重的大小排序,选择具有较大的权重词作为该数据的特征词,降低文本表示向量的维度;S4:文档数据库建立:根据数据索引和动态查询的需求,并以单个文档数据的形式建立存储数据库,本发明结合医疗健康资讯类数据的特点,运行改进型的特征提取算法,更合理的计算医疗健康资讯的特征词权重,从而使特征选择更加准确,同时根据医疗健康资讯的动态变化特点,引入增量学习的方法到特征提取过程中,解决了训练文本集动态变化,提高训练分类的准确性。 | ||
搜索关键词: | 医疗健康 特征词 权重 资讯 动态变化 特征选择 大数据 预处理 数据处理技术 特征提取过程 特征提取算法 存储数据库 文档数据库 训练文本集 动态查询 分类数据 近邻分类 数据索引 文本表示 文档数据 训练分类 增量学习 改进型 分类 维度 向量 排序 引入 健康 | ||
【主权项】:
1.一种医疗健康大数据的分类方法,其特征在于:该方法的具体步骤如下:S1:分类数据预处理:针对分类前的数据减少或清除噪声以及处理缺失值,使用神经网络对数据进行归一化变化;S2:数据的近邻分类:给定一个特定分类样本,从数据集中找出与之最近的前K个邻居,然后根据这些邻居的类别来判定该样本的类别;S3:特征选择:按照特征词的权重的大小排序,选择具有较大的权重词作为该数据的特征词,降低文本表示向量的维度,从而降低计算机的计算复杂程度;S4:文档数据库建立:根据数据索引和动态查询的需求,并以单个文档数据的形式建立存储数据库。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于文丹,未经文丹许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201810511473.6/,转载请声明来源钻瓜专利网。
- 上一篇:动态口令生成方法、装置及系统
- 下一篇:一种家族文化记录管理系统