[发明专利]一种基于相关向量机的数字化肺音特征降维方法有效

专利信息
申请号: 201610229273.2 申请日: 2016-04-13
公开(公告)号: CN105913066B 公开(公告)日: 2019-04-26
发明(设计)人: 刘国栋 申请(专利权)人: 刘国栋
主分类号: G06K9/46 分类号: G06K9/46;G06K9/40;G10L21/0208
代理公司: 北京永创新实专利事务所 11121 代理人: 姜荣丽
地址: 300350 天津*** 国省代码: 天津;12
权利要求书: 查看更多 说明书: 查看更多
摘要: 发明公开了一种基于相关向量机的数字化肺音特征降维方法,属于数字医疗技术领域。本发明将特征空间映射到样本空间,利用互信息特征核函数来表征肺音样本特征属性之间的联系强度,最终实现肺音特征的降维。包括在肺音数据库中选择肺音数据作为肺音样本,建立相关向量机;建立肺音特征向量样本集;基于RVM肺音特征向量降维。本发明具有鲁棒性和稀疏性的优点,对数据噪声不敏感,减少了采集噪声引起的不确定性;适合于处理高维肺音特征的情况。本发明中提出的降维方法利用肺音特征间的互信息作为核函数,在模型中充分考虑了特征之间的联系强度,不仅保障了降维结果的简约性,同时保障了保留特征的完备性。
搜索关键词: 一种 基于 相关 向量 数字化 特征 方法
【主权项】:
1.一种基于相关向量机的数字化肺音特征降维方法,其特征在于:包括如下步骤,第一步,在肺音数据库中以相等的数据量选择干罗音、湿罗音及无罗音肺音数据,并且每种肺音数据类型不少于200条肺音数据,将选择的肺音数据作为肺音样本,建立相关向量机;第二步,建立肺音特征向量样本集T为:T={(X1,Y1),(X2,Y2),…(Xn,Yn)};对于每一个肺音样本选取38个肺音特征f1,f2,…f38构成相应肺音样本的特征向量X,即X=(f1,f2,…f38),则对于第i个肺音样本(Xi,Yi)对应的特征向量为Xi,Xi∈R38,i=1,2,…,n,n为肺音样本个数,n≥600;其中Yi的定义为:若第i个肺音样本为无罗音数据,则Yi=1;若第i个肺音样本为干罗音数据,则Yi=2;若第i个肺音样本为湿罗音数据,则Yi=3;第三步,基于RVM肺音特征向量降维,具体为:3.1 建立基于RVM的肺音特征降维模型;所述的基于RVM的肺音特征降维模型如下:其中fj为特征向量X=(f1,f2,…f38)中的第j个肺音特征,ε是零均值、方差为σ2的高斯噪声,αj为肺音特征fj的权重;为了能处理非线性的情况,引进了函数φ():将z映射为φ(z);将fj映射为φ(fj),j=1,2,…,38,则基于RVM的肺音特征降维模型即公式(2)变换为如下函数形式:3.2 构建互信息特征核函数,具体为,给定一个肺音样本中的任意两个肺音特征fu和fv,u=1,2,...,38,v=1,2,...,38,u≠v;对于给定的训练样本集T={(X1,Y1),(X2,Y2),…(Xn,Yn)},每一个肺音样本(Xi,Yi)中都存在两个肺音特征fu和fv;因此得到2个向量Fu={fu1,fu2,…fun},Fv={fv1,fv2,…fvn},其中fui表示肺音样本(Xi,Yi)中肺音特征fu的取值,fvl表示肺音样本(Xi,Yi)中肺音特征fv的取值,i=1,2,...,n,n为肺音样本个数;用下述这种方法计算两个肺音特征的互信息特征核函数K(fu,fv):1)将向量{fu1,fu2,…fun}和向量{fv1,fv2,…fvn}分别划分成N个大小相同的特征区间,N=5;2)将向量{fu1,fu2,…fun}和向量{fv1,fv2,…fvn}的各个元素离散化到每一个特征区间中,如果向量{fu1,fu2,…fun}中的最大值和最小值分别是umax和umin,那么每个特征区间的大小为(umax‑umin)/5;若向量{fu1,fu2,…fun}中的某个分量的值fuk落在第k个特征区间中,则fui=k,k=1,2,…,N;3)计算概率密度函数p(fu,fv),p(fu)和p(fv):p(fu=l)=counts(fu=l)/np(fv=z)=counts(fv=z)/np(fu=l,fv=z)=counts(fu=l,fv=z)/n其中,counts(fu=l)表示向量{fu1,fu2,…fun}中落在第l个区间的分量的个数,l=1,2,…,N,counts(fv=z),表示向量{fv1,fv2,…fvn}中落在第z个区间的分量的个数,z=1,2,…,N;由此,将互信息核函数定义为,由互信息核函数的特性可知其满足对称非负:K(fu,fv)=K(fv,fu)  (8)K(fu,fv)≥0  (9)互信息特征核函数同样也满足Mercer条件,保证了RVM算法的收敛性;3.3 基于RVM的肺音特征向量降维模型求解,包括求解肺音特征权重α={α1,α2,…,α38},和方差为βi,具体为:给定训练样本集T={(X1,Y1),(X2,Y2),…(Xn,Yn)},训练样本集T的似然函数为:其中,φ(X)=[φ(f1),φ(f2),...,φ(f38)];||φ(y)‑φ(X)α||2=φ(y)Tφ(y)‑2αTφ(X)Tφ(y)+αTφ(X)Tφ(X)α=K(yT,y)‑2αTK(XT,y)+αTK(XT,X)α  (11)其中,为了保证RVM模型的稀疏性,假设肺音特征权重αi符合均值为0、方差为βi的正态分布,即αi~N(0,βi),i=1,2,...,38,则肺音特征的权重α={α1,α2,…,α38}服从概率分布p(α|β):因此求解α={α1,α2,…,α38}的问题与最大化后验概率p(α,β,σ2|φ(y))等价;利用贝叶斯公式得,p(α,β,σ2|φ(y))=p(α|φ(y),β,σ2)p(β,σ2|φ(y))  (14)其中p(α|φ(y),β,σ2)表示已知φ(y),β,σ2的条件下权重向量α={α1,α2,…,α38}的概率分布,p(β,σ2|φ(y))表示已知φ(y)的条件下,β={β1,β2,…,β38}和σ2的联合概率密度;求解参数α={α1,α2,…,α38}、β和σ2的过程具体为:(1)首先最大化计算p(α|φ(y),β,σ2):通过定义的核函数替代后得到协方差矩阵∑和均值μ的方程:∑=(σ‑2K(XT,X)+A)‑1  (16)μ=σ‑2∑K(XT,y)  (17)其中协方差矩阵∑为一个38阶的方阵,第i行第j列的元素表示为∑ij,第i行为一个38维的行向量,记为∑i;A=diag(β1,β2,…,β38),μ={μ1,μ2,…,μ38};(2)最大化p(β,σ2|φ(y)),从而计算出参数β和σ2E为38阶的单位阵;通过偏微分得到更新参数β和噪声方差σ2的方程:γi=1‑βiii i=1,2,...,38  (20)经过(1)和(2)步骤反复迭代计算来更新各个参数,最终将会得到稀疏的肺音特征权重{α1,α2,…,α38},非零权重所对应的肺音特征即是所求的降维后的“相关特征”。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于刘国栋,未经刘国栋许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/patent/201610229273.2/,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top