[发明专利]基于PCA和PSO-KELM模型的乳腺癌诊断系统有效
申请号: | 201710878027.4 | 申请日: | 2017-09-26 |
公开(公告)号: | CN107767946B | 公开(公告)日: | 2020-10-02 |
发明(设计)人: | 潘娟;鲍东海;丁佳骏;何熊熊 | 申请(专利权)人: | 浙江工业大学 |
主分类号: | G16H50/20 | 分类号: | G16H50/20;G01N15/10;G01N21/84 |
代理公司: | 杭州天正专利事务所有限公司 33201 | 代理人: | 王兵;黄美娟 |
地址: | 310014 浙江省杭州*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 基于PCA和PSO‑KELM模型的乳腺癌诊断系统,对乳腺癌病理数据指标进行分析,应用乳腺癌诊断模型分析、预测乳腺癌各项数据指标,对乳腺癌患者良、恶性的诊断结果进行分类、预测并提出具有科学性、针对性及有效性的防疗措施,通过医疗设备显示器显示患者的最终诊断结果。其中乳腺癌诊断模型是对患良、恶性患者的病理数据进行预处理之后,提取高维的乳腺癌病理数据中占主导作用的低维综合指标,把低维综合指标作为该模型的输入向量进行试验,利用粒子方法对模型中的参数进行优化,最后得到稳定的系统参数,加快该模型的收敛速度及分类的准确率。 | ||
搜索关键词: | 基于 pca pso kelm 模型 乳腺癌 诊断 系统 | ||
【主权项】:
基于基于PCA和PSO‑KELM模型的乳腺癌诊断系统,其主要特征在于对乳腺癌疾病的病理指标进行分析,应用乳腺癌诊断模型分析、预测乳腺癌各项数据指标,建立样本数据库,对乳腺癌患者良、恶性的诊断结果进行分类、预测并提出具有科学性、针对性及有效性的防疗措施;其中乳腺癌诊断模型是对患良、恶性患者的病理数据进行预处理之后,提取高维的乳腺癌病理数据中占主导作用的低维综合指标,把低维综合指标作为该模型的输入向量进行试验,利用粒子群方法对乳腺癌诊断模型中的参数进行优化,最后得到稳定的系统参数,加快该乳腺癌诊断模型的收敛速度及分类的准确率;采用计算机程序语言编写的乳腺癌诊断模型包括基于数据主元分析模块、基于人工神经网络评价分析模块、基于粒子群优化参数分析模块;病理数据采集:选取具有丰富临床经验的医生对乳腺肿块通过病理学细针穿刺方法获得细胞组织;然后医生将具有细胞组织的载玻片放在选取来自不同视野的显微镜下进行检测、观察乳腺肿瘤病灶组织中细胞核所显示的检测参数,包括细胞核的直径、质地、周长、面积、光滑度、紧密度、凹陷度、凹陷点数、对称度、断裂度10个量化特征的平均值、标准差以及最坏值,共30个数据指标;利用乳腺癌诊断模型进行病理数据预测分析,根据病理数据的自身特性选择合适的预测模型;基于数据主元分析模块,其数据表达式如下:对式(1)样本数据矩阵进行主成分分析,根据协方差矩阵X求出其相应的特征值,根据每个特征值对应的累积贡献率所占比例的大小优选出主要特征指标,如下公式所示:σi=λiΣj=1mλjηa=Σi=1aσi=Σi=1aλiΣi=1mλi---(2)]]>其中,用σi和ηa分别表示主元yi的方差贡献率和前a个主元的累计贡献率,λ表示特征值,m表示取前几个主要特征指标的个数;一般情况下,取前m个累积贡献率大于85%的主成分综合指标个数,从而达到了降低维度的目的,前m个主成分指标能够完全反映原始乳腺癌病理数据的大量信息,这些主成分就是原始信息的线性组合;其表达式如下所示:y1=a11x1+a12x2+...+a1,10a30y2=a21x1+a22x2+...+a2,10x30...y10=a10,1x1+a10,2x2+...+a10,10x30---(3)]]>公式(3)中,y=[y1,y2,...,y10]表示其中经过主元分析模型处理后的低维医疗病理数据,由原先30维的乳腺癌病理数据指标降维变成了10个毫不相关的主成分指标,这些指标之间是互不重叠的;通过计算将原始数据和相应的系数矩阵做内积,得到降维后的矩阵Y所示:Y569*10=X569*30*a30*10;基于人工神经网络评价分析模块:经过基于数据主元分析模块降维后,将10个主成分的综合指标作为极限学习机模型的输入样本,将输入样本和输入权重的内积再加上阈值通过非线性的激活函数模型来映射,得到一个隐含层的输出响应,将当前隐含层的输出响应作为输出层的输入样本与权重进行内积,得到最终的分类函数模型;为了获得一个ELM网络的最佳模型,ELM在输出过程中不但要考虑到连接隐含层与输出层之间的权值最小化,而且还要保证网络模型的实际输出值和目标输出值之间的误差达到最小,即保证模型的输出权重最小化及输出误差最小化,当两个最小化参数其中一个没有达到最小化的标准,那么所得到的模型可能会产生过拟合状态及其他不良状态;因此,要保证模型中这两个最小化参数之间的比例,使他们达到一定的动态平衡,,一个良好的ELM模型输出层分类目标函数为:Min:LELM=12||β||2+12CΣp=1N||ξ||2---(4)]]>Subject to:h(xp)β=tpT‑ξpT (5)P=1,2,…N表示样本的个数,tp表示为网络的实际输出值,其中代表输出层输出的最小权重,即结构风险最小;代表输出误差最小,即经验风险最小,C表示为正规化系数,类似于支持向量机模型中的惩罚系数,因为结构风险和经验风险这两个指标之间是相互矛盾的,用正规化系数C来调节这两个指标之间的比例关系;该模型中输出层中的实际输出向量和目标向量之间存在着一定误差,该训练误差用||ξp||来表示;通过ELM训练模型所得出的线性系统输出值的解与如下对偶问题是等价的,如下所示这是根据卡罗需‑库恩‑塔克(Karush‑Khu‑Tucker)的理论公式所得;Min:LDELM=12||β||2+12CΣp=1N||ξp||2-Σp=1Nαp(h(xp)β-tp+ξp)---(6)]]>其中αp为非负数,称之为拉格朗日乘子;我们根据Karush‑Khu‑Tucker的相应优化限制条件进行求解结果如下:∂LDELM∂ξp=0⇒αp=Cξp---(7)]]>∂LDELM∂β=0⇒β=Σp=1Nαph(xp)T⇒β=HTα---(8)]]>∂LDELM∂αp=0⇒h(xp)β-tp+ξp=0---(9)]]>其中H=[hT(x1),…,hT(xN)]T就是隐含层输出的映射矩阵,实际上矩阵H与输出层中所含的节点的个数没有关系,但是与输入层和隐含层的样本的节点个数关系密切;将公式(8)和(9)带入到公式(10),可得h(x1)HTCξ1-t1T+ξ1=0...h(xN)HTCξN-tNT+ξN=0---(10)]]>将(11)中的公式进行合并整理:令将其公式合并如下:(IC+HHT)α=T---(11)]]>将公式(11)带入到公式(9)中,可以得到输出权重β:β=HT(IC+HHT)-1T---(12)]]>最后可以得出ELM的非线性逼近函数:f(xi)=h(xi)HT(IC+HHT)-1T---(13)]]>在ELM模型中,H是隐含层输出矩阵,从上面公式推到中可以发现H是有激活函数做成的输出矩阵,由于ELM模型中权重和阈值的值在训练前是随机产生的,这样就导致H矩阵中的值是不确定的,因此每次进行ELM建模时,输出层输出的权重值也是不确定的,导致整个模型的泛华能力差、随机波动性大;为了进一步加强该模型的稳定性、泛化能力以及抗鲁棒性,将ELM模型和支持向量机模型(SVM)的原理进行对比,根据Mercer’s的条件寻找一个满足需求的核函数模型,并提议将核函数应用到ELM中,其核矩阵的公式如下所示,从而提出了一种新型的人工神经网络—核极限学习机模型,简称KELM;Ω=HHT:Ωi,j=h(xi).h(xj)=K(xi,xj) (14)其中,Ω是一个N*N的对称矩阵,K(xi,xj)为核函数;从公式(14)中存在着HHT矩阵,对该矩阵进行详细推算并发现存在着矩阵的内积形式,就将上面的核函数来替换其内积形式,其公式如下,这样不仅使计算复杂度降低了,而且我们只需知道核函数的形式就可以求出其输出函数,无需知道隐含层中的映射函数h(xi)的具体形式;HHT=h(x1)h(x2)...h(xN)N×Lh(x1)h(x2)...h(xN)N×L---(15)]]>如上面公式(15)所示,可以将函数h(x)的内积由核函数的隐式隐射来代替,即将HHT用满足merce条件的核函数来替换,具体形式如下:其中,h(x)HT=K(x,x1)K(x,x2)...K(x,xN)---(17)]]>ΩELM是一个N*N的对称矩阵,由此可得到KELM模型求解的输出过程为:f(x)=K(x,x1)K(x,x2)...K(x,xN)(IC+ΩKELM)-1T---(18)]]>基于上面公式中核函数我们可以有很多种选择,经过多次实验测试显示,本次实验选择径向基函数作为核函数,该函数具有泛化能力好,平滑性强等优势;综上所述,将核函数模型的优势与ELM模型相结合,用核矩阵ΩKELM代替ELM模型中的随机矩阵HHT,充分利用核函数的作用,将其低维输入的样本数据映射到高维的隐含层特征空间中,保证其能够准确、有效地进行分类;基于公式(18)KELM模型逼近函数的最终输出中可以发现只要正规化系数C确定,该函数中核函数K(xi,xj)的具体形式以及具体参数已知,与此同时,核函数对称矩阵ΩKELM的映射值是不可变值,最后输出层输出的权重最终是一个稳定的确定值;与之前的ELM输出模型相对比,KELM在重复构建模型时,所得的的值为确定值;也避免了ELM模型中隐含层中的权值和阈值的随机设置是模型的波动性大、不稳定的重大问题,大大增加了KELM模型的稳定性和泛化能力;针对公式(18)中的正规化系数C,调节结构风险最小和经验风险最小的比例值,C值的波动大小都会给结构风险和经验风险的带来一定的波动;g是核函数的一个核宽参数,主要是用来控制径向基函数的径向作用范围,反映了函数的非线性映射本质;核宽g的取值的不同,会得到不同的核函数;所以参数C和g对KELM模型的性能影响挺大的;基于粒子群优化参数分析模块:这里就采用粒子群算法对参数C和g寻找最佳的参数,建立了用粒子群算法优化KELM模型中参数的算法预测模型;具体包括:粒子的位置和速度生成子模块,在(C,g)的取值空间内随机生成初始化的每个粒子p=(p1,p2,…pm)的位置xi(t)=[Ci(t)gi(t)]T和速度Vi(t)=[ΔCi(t)Δgi(t)]T;迭代寻优子模块,应用PSO算法对KELM模型进行参数的迭代寻优,最大迭代次数是80次,种群的数量规模是30,在5折交叉验证意义下的平均误差率作为适应度函数,用平均误差率最为适应值来确定当前pi的个体最极值pibest(t)=(Cibest(t)gibest(t))T和群体极值gibest(t)=(Cibest(t)gibest(t))T;根据下面的公式来更新种群中每个粒子pi的速度和位置;vi(t+1)=w(t)vi(t)+c1r1(pibest(t)‑xi(t))+c2r2(gibest(t)‑xi(t)) (19)xi(t+1)=xi(t)+vi(t+1) (20)其中c1和c2为学习因子,r1和r2为均匀分布在(0,1)之间的随机数字;判断子模块,判断是否达到最大的迭代次数或者适应度函数值小于终止误差,如果满足,就停止迭代得到最优的解,最佳的正规化系数C=131.5269,核函数宽度是g=1.5855,将所得到的最佳参数C、g对KELM模型进行学习和分类预测,找出最小的分类误差率,优化过程结束;如果没有满足条件则优化过程继续,转到迭代寻优子模块继续进行迭代;将得到的最优参数通过KELM模型进行训练,最后输出对乳腺癌疾病进行诊断、分析的结果。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于浙江工业大学,未经浙江工业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201710878027.4/,转载请声明来源钻瓜专利网。
- 上一篇:一种基于手环控制的服务管理系统
- 下一篇:放疗计划评估方法及装置