[发明专利]一种基于统计学习的心电图数据处理方法在审
申请号: | 202110518052.8 | 申请日: | 2021-05-12 |
公开(公告)号: | CN113407591A | 公开(公告)日: | 2021-09-17 |
发明(设计)人: | 徐赤坤;谭铤;刘康;李伟;何俊德 | 申请(专利权)人: | 上海图灵医疗科技有限公司 |
主分类号: | G06F16/2458 | 分类号: | G06F16/2458;G06F16/84;G06K9/62;G16H10/60 |
代理公司: | 上海邦德专利代理事务所(普通合伙) 31312 | 代理人: | 梁剑 |
地址: | 200240 上海市闵*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 统计 学习 心电图 数据处理 方法 | ||
1.一种基于统计学习的心电图数据处理方法,其特征在于,包括以下步骤:
S1、将心电图xml数据文件进行读取,转化成csv或txt格式数据;
S2、对所述步骤S1中的数据进行异常检测,检查文件转化是否成功;
S3、当所述步骤S2中判断转化成功时,对心电图数据进行特征提取,计算正交规范傅里叶基;
S4、当所述步骤S2中判断转化失败时,则是输入数据格式错误;
S5、根据统计学习,进行最小二乘法对样本库数据计算特征矩阵;
S6、对录入待分类的样本数据,计算其与特定样本库中样本数据的距离分类并获得不同人群心电信号特征的分析数据比对结果的数据量化指标值或指标值函数变化曲线。
2.如权利要求1所述的一种基于统计学习的心电图数据处理方法,其特征在于,所述步骤S1包括以下步骤:
S11、将特定人群1样本数据文件以xml格式读入;
S12、将特定人群2样本数据文件以xml格式读入;
S13、将步骤S11与步骤S12的每个xml数据文件转化为csv或txt格式,方法为提取xml,文件中每两个digits特征点中的数据,整理成12维数据后重新储存为csv或txt格式;
S14、判断csv或txt格式心电图数据中是否存在奇异点。
3.如权利要求2所述的一种基于统计学习的心电图数据处理方法,其特征在于,所述步骤S1还包括以下步骤:
S15、读取特定人群1样本的csv或txt数据,20000*12的12维导联时间序列或20000*1的单导联时间序列;
S16、对于步骤S15所得的一维时间序列进行规范化处理,步骤如下:
S161、对序号2000至18000的数据求二阶差分,确定其最小值,定义阈值,取出所有二阶差分小于最小值乘以阈值的片段;
S162、针对S161中所得片段,求出对应心电信号的中位数,返回中位数对应单元,即具有代表意义的最大值单元;
S163、切割该具有代表意义的最大值单元后2000个单元作为规范化时间序列(2000*1的向量);
S17、对规范化时间序列进行函数型数据转化,步骤如下:
S171、设置固定时间区间[0,1000],确定该区间上的300个正交规范傅里叶基;
S172、通过最小二乘法计算与规范化数据最为接近的傅里叶基的线性组合,输出组合的系数作为函数型数据的特征表示(300*1的向量),公式如下:
其中s代表S163取的的待拟合序列,ei为S171中的第i个傅里叶基,v(s)即所需函数型数据特征表示;
S18、储存步骤S17函数型数据的系数,作为特定人群1的特征数据库(300*n的矩阵),其中n为特定人群1的样本数据总量;
S19、对于特定人群2的数据,重复上述步骤,获取特定人群2的特征数据库(300*m的矩阵),其中m为特定人群2的样本数据总量。
4.如权利要求3所述的一种基于统计学习的心电图数据处理方法,其特征在于,所述步骤S15还包括以下步骤:
S151、当输入为12导联的心电信号,则进行VCG(Vectorcardiogram,心电向量图)线性变化,输出VCG的第一分量作为一维时间序列;
S152、当输入为单导联心电信号,则保留数据作为一维时间序列。
5.如权利要求1所述的一种基于统计学习的心电图数据处理方法,其特征在于,还包括将待分类心电信号的分析,包括以下步骤:
S61、将待分类的心电数据文件以xml格式读入;
S62、将xml数据转化为csv或txt格式;
S63、录入上述csv或txt格式数据,进行数据文件规范化及函数型数据转化步骤中的S15、S16及S17,获取该心电信号的函数型特征表示300*1的向量;
S64、对上述函数型特征表示进行回归分析并输出结果,其中用于回归分析的算法包括KNN(k-nearest neighbor,K值近邻法)算法与SVM(Support Victor Machine,支持向量机)算法;
所述KNN算法:
S651、计算步骤S63取得的特征表示与数据文件规范化及函数型数据步骤中S18步骤特定人群1的特征数据的距离,即步骤S63中取得的特征表示与数据文件规范化及函数型数据步骤中S18步骤特定人群1的特征数据库矩阵的列向量的距离的最小值,该距离的计算方法包括:
S6511、欧氏距离;
S6512、最小K个欧式距离的调和平均数:
S652、计算步骤S63取得的特征表示与数据文件规范化及函数型数据步骤中S19步骤特定人群2的特征数据的距离,即步骤S63中取得的特征表示与数据文件规范化及函数型数据步骤中S19步骤特定人群2的特征数据库矩阵的列向量的距离的最小值,距离计算方法同S651;
S653、将步骤S651与步骤S652中的输出的最小值进行比较输出比对数据,输出分类结果;
所述SVM算法:
S66、使用Soft-margin的成本函数对上述数据文件规范化及函数型数据步骤中S18步骤与S19步骤取得的两个特征数据库库进行线性分离,优化公式如下(设特定人群1与特定人群2的对应标签分别为-1和1,其特征数据样本库大小分别为m0和m1):其中xi,yi分别为样本库中特征向量和标签,b和lambda为可调参数;
对于新录入数据x,计算wx-b,若其大于等于1则归类为特定人群2,小于等于-1则归类为特定人群1。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海图灵医疗科技有限公司,未经上海图灵医疗科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110518052.8/1.html,转载请声明来源钻瓜专利网。