[发明专利]针灸临床数据预处理控制系统及方法、信息数据处理终端在审

专利信息
申请号: 201910907693.5 申请日: 2019-09-24
公开(公告)号: CN110689943A 公开(公告)日: 2020-01-14
发明(设计)人: 李骥;曹亮;赵卓宁;刘魁;罗飞;魏乐 申请(专利权)人: 成都成信高科信息技术有限公司
主分类号: G16H20/40 分类号: G16H20/40;G16H50/70
代理公司: 11246 北京众合诚成知识产权代理有限公司 代理人: 马超前
地址: 610200 四川省成都*** 国省代码: 四川;51
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 病历 相关信息 自然语言 预处理 数据挖掘技术 数据挖掘算法 信息数据处理 信息化建设 预处理控制 预处理模块 动态增长 分词处理 分词模块 海量数据 临床数据 临床行为 提取处理 提取模块 挖掘算法 医学诊断 原始数据 主题描述 转化模块 数据集 数据量 文档 约简 隐含 针灸 词汇 文本 终端 诊断 挖掘 医学 转换 记录 医生 转化 应用 探索
【说明书】:

发明属于数据挖掘技术领域,公开了一种针灸临床数据预处理控制系统及方法、信息数据处理终端;包括预处理模块、分词模块、提取模块、转化模块;控制方法通过约简、转换及消除同效异名对原始数据进行清理,给出临床行为关系对原始病历的相关信息进行预处理;对原始病历的相关信息进行分词处理;利用有限的隐含主题描述文档,每个主题由诸多词汇组成,对原始病历的相关信息进行提取处理;把自然语言记录的文本病历转化成为易于应用挖掘算法的数据。本发明可以挖掘出有很高医学价值的医学诊断规则;提高医生的诊断水平,同时为中医药信息化建设作出有益探索;数据挖掘算法面临的数据集将是动态增长的,并且随着用户的增多数据量将朝海量数据发展。

技术领域

本发明属于数据挖掘技术领域,尤其涉及一种针灸临床数据预处理控制系统及方法、信息数据处理终端。

背景技术

目前,业内常用的现有技术是这样的:目前,针灸数据是从各个实际应用系统中获取的,由于各应用系统的数据缺乏统一标准和定义,不能直接拿来使用,并且由于实际系统设计时存在的缺陷以及一些使用过程中人为因素造成的影响,数据记录中可能会出现数据属性的值丢失或不确定的情况,还可能缺少必须的数据而造成数据不完整,这些都需要进行大量细致而严谨的数据预处理工作,并且由于针灸数据本身的特殊性,故不能直接将数据挖掘技术中的现有技术原封不动的用于针灸数据的与处理上,而目前针对大数据或海量数据的挖掘本身就是数据挖掘领域的研究难点和热点,所以还需要保证所设计的数据挖掘算法能够在海量数据的情况想也能够有较快的响应时间。

综上所述,现有技术存在的问题是:

(1)现有的针灸数据存在不能直接拿来使用,容易造成数据不完整的问题对病例信息的提取较繁琐。

(2)传统方法提取信息采用词表示文档,特征粒度较细,往往存在稀疏性,如内容十分相近的内容使用不同措辞表达同一概念时,词特征向量计算出的相似度往往较低。

(3)在查找病例资料的时候对于紧缩词经常会识别错误,降低了病例信息的准确率。

发明内容

针对现有技术存在的问题,本发明提供了一种针灸临床数据预处理控制系统及方法、信息数据处理终端。

本发明是这样实现的,一种针灸临床数据预处理控制方法,所述针灸临床数据预处理控制方法包括:

步骤一,通过约简、转换及消除同效异名对原始数据进行清理,给出临床行为关系,对原始病历的相关信息进行预处理;

步骤二,对原始病历的相关信息进行分词处理;

步骤三,利用有限的隐含主题来描述文档,每个主题由诸多词汇组成,对原始病历的相关信息进行提取处理;

步骤四,把自然语言记录的文本病历转化成为挖掘算法的数据。

进一步,所述步骤一中:原始病历预处理的具体方法为:

(1)临床行为的数据清理:原始数据中与最终挖掘不相关的属性,进行归约处理,选择抽取有关部分,对病人姓名、年龄、性别无关属性进行删减,得到数据由病例ID和临床行为记录组成,以行为作为病例的维,建立行为从表,记录每个病例中每项行为的开始时间和结束时间,同时统计时间长度;

(2)经过清理后的行为数据相互间具有时序特性,任意两个行为时序关系或为顺序关系或为开列关系,相关定义如下:

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于成都成信高科信息技术有限公司,未经成都成信高科信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201910907693.5/2.html,转载请声明来源钻瓜专利网。

同类专利
专利分类
×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top