[发明专利]一种乳腺肿瘤的建模与诊断方法在审
申请号: | 201610094313.7 | 申请日: | 2016-02-20 |
公开(公告)号: | CN105574356A | 公开(公告)日: | 2016-05-11 |
发明(设计)人: | 周栋 | 申请(专利权)人: | 周栋 |
主分类号: | G06F19/00 | 分类号: | G06F19/00 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 311800 浙江省绍*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 乳腺 肿瘤 建模 诊断 方法 | ||
【技术领域】
本发明涉及乳腺肿瘤诊断技术领域,特别是基于聚类分析与软测量建模的 乳腺肿瘤诊断方法的技术领域。
【背景技术】
目前,乳腺肿瘤已经成为世界上妇女发病率最高的癌症,研究表明,乳腺 恶性肿瘤若能早期发现、早期诊断、早期治疗,可以取得良好的效果。现有的 研究与诊断方法,尤其是对乳腺图像的分析日趋成熟。医学研究表明,乳腺肿 瘤病灶组织的细胞核显微图像与正常组织的细胞核显微图像不同,但是用一般 的图像处理技术很难对其进行区分。因此,运行科学的方法,根据乳腺肿瘤病 灶组织的细胞核显微图像来对乳腺肿瘤进行良性、恶性的诊断显得十分重要。
本发明是获取乳腺肿瘤病灶组织的细胞核显微图像数据库的数据,将细胞 核图像的量化特征作为输入,来建立与肿瘤性质的关系,即是可以根据该细胞 核显微图像的量化特征来诊断乳腺肿瘤是良性还是恶性。
【发明内容】
本发明的目的就是解决现有技术中的问题,提出一种乳腺肿瘤的建模与诊 断方法,可以根据组织细胞核显微图像的量化特征来直观的诊断肿瘤性质。
为实现上述目的,本发明提出了一种乳腺肿瘤的建模与诊断方法,所述方 法利用传播仿射聚类方法(AP)来对数据库的细胞核显微图像进行样本分类, 再通过偏最小二乘算法(PLS)对聚类结果进行软测量建模,最后利用开关连接 的方式得到多模型的输出,即乳腺肿瘤的性质,具体步骤包括:
(a)数据预处理:确定样本数量与样本维数,划分训练样本与测试样本, 对所有样本中的数据进行“3σ”筛选;
(b)聚类分析:利用AP算法自动对训练样本进行聚类分析,得到聚类中 心与每一类的样本集;
(c)软测量建模:通过PLS对聚类获得的每一类样本集进行软测量建模, 分别获得对应的输出结果,即良性为“0”,恶性为“1”;
(d)多模型连接:利用测试样本测试(c)步骤中建立的多模型,并计算 各测试样本的隶属度作为多模型开关连接的判断依据。
作为优选,所述(a)步骤中,样本维数为10,组织细胞核显微图像的量化 特征分别为细胞核半径、质地、周长、面积、光滑性、紧密度、凹陷度、凹陷 点数、对称度、断裂度。
作为优选,所述(b)步骤中,传播仿射聚类算法(AP)不需要初始化确定 聚类数与聚类中心,可以对训练样本实现自动分类。
作为优选,所述(d)步骤中,测试样本测试多模型时,各个子模型的输出 可能不同,在最后诊断肿瘤性质时,需计算测试样本与聚类中心的隶属度,隶 属度最大所对应的输出结果即是最终的诊断结果。
本发明的有益效果:本发明通过采集病灶组织细胞核显微图像的量化特征, 来建立与肿瘤性质之间的关系,建模方法直观,而利用传播仿射聚类算法(AP) 与偏最小二乘算法(PLS)来建模的多模型使得最终的诊断结果精度高,大大降 低了误诊率。
本发明的特征及优点将通过实施例进行详细说明。
【具体实施方式】
本发明一种乳腺肿瘤的建模与诊断方法,具体步骤包括:
步骤一、确定样本数量与样本维数,划分训练样本与测试样本,对所有样 本中的数据进行“3σ”筛选;
步骤二、利用AP算法自动对训练样本进行聚类分析,得到聚类中心与每一 类的样本集;
步骤三、通过PLS对聚类获得的每一类样本集进行软测量建模,分别获得 对应的输出结果,即良性为“0”,恶性为“1”;
步骤四、利用测试样本测试(c)步骤中建立的多模型,并计算各测试样本 的隶属度作为多模型开关连接的判断依据。
其中,步骤二的传播仿射聚类算法(AP)避免了传统聚类算法中需要事先 确定初始聚类数目和聚类中心的问题,且所得聚类中心必定是样本中的点,防 止产生没有实际意义的聚类中心。
仿射聚类算法的基本步骤为:
1、设置参考度P,计算相似度矩阵,令S(i,i)=p,i=1,2,…n,初始化阻尼系 数lam=median(S),证据矩阵R(i,k)=0,A(i,k)=0,(i=1,2,…,n;k=1,2,…,n)。
2、根据下列公式,更新证据矩阵R(i,k)及A(i,k):
R(i,k)=S(i,k)-max[A(i,j)+S(i,j)]j∈(1,2,…k-1,k+1,…,n)
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于周栋,未经周栋许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201610094313.7/2.html,转载请声明来源钻瓜专利网。
- 同类专利
- 专利分类
G06F 电数字数据处理
G06F19-00 专门适用于特定应用的数字计算或数据处理的设备或方法
G06F19-10 .生物信息学,即计算分子生物学中的遗传或蛋白质相关的数据处理方法或系统
G06F19-12 ..用于系统生物学的建模或仿真,例如:概率模型或动态模型,遗传基因管理网络,蛋白质交互作用网络或新陈代谢作用网络
G06F19-14 ..用于发展或进化的,例如:进化的保存区域决定或进化树结构
G06F19-16 ..用于分子结构的,例如:结构排序,结构或功能关系,蛋白质折叠,结构域拓扑,用结构数据的药靶,涉及二维或三维结构的
G06F19-18 ..用于功能性基因组学或蛋白质组学的,例如:基因型–表型关联,不均衡连接,种群遗传学,结合位置鉴定,变异发生,基因型或染色体组的注释,蛋白质相互作用或蛋白质核酸的相互作用