[发明专利]基于双重自适应邻域半径的多粒度乳腺癌基因分类方法有效
申请号: | 202110845531.0 | 申请日: | 2021-07-26 |
公开(公告)号: | CN113838532B | 公开(公告)日: | 2022-11-18 |
发明(设计)人: | 丁卫平;耿宇;鞠恒荣;黄嘉爽;程纯;孙颖;张毅;李铭;秦廷桢;沈鑫杰;王海鹏 | 申请(专利权)人: | 南通大学 |
主分类号: | G16B40/20 | 分类号: | G16B40/20;G06K9/62;G16H50/20;G16H50/70 |
代理公司: | 南京经纬专利商标代理有限公司 32200 | 代理人: | 张俊俊 |
地址: | 226019 *** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 双重 自适应 邻域 半径 粒度 乳腺癌 基因 分类 方法 | ||
本发明提供了一种基于双重自适应邻域半径的多粒度乳腺癌基因分类方法,读取大规模基因位点数据并做归一化处理,并对大规模基因位点进行数据分析;利用轮廓系数和PCA降维可视化相结合方式,选取最佳K值,调整信息粒化的模型;其次,使用启发式约简算法分别实现基于簇心距离自适应邻域半径的多粒度属性约简基于属性包含度的邻域半径的多粒度属性约简,并采用SVM支持向量机机器学习分类算法对乳腺癌基因大数据进行分类和预测。本发明的有益效果是:调整惩罚项使模型在乳腺癌基因分类具有较高的准确率和召回率,去除大规模数据中冗余属性,提高了计算效率,利用样本之间的支持信息,提升了乳腺癌数据分类的效率和精度。
技术领域
本发明涉及医学信息智能处理技术领域,尤其涉及一种基于双重自适应邻域半径的多粒度乳腺癌基因分类方法。
背景技术
癌症是一种最为常见的基因疾病,经相关医学研究表明肺癌、皮肤癌和乳腺癌与基因密切相关;癌症的出现往往都可以通过基因突变来解释,遗传物质受损没有修复,癌细胞会吸收正常细胞的养分无限分裂导致人体功能衰退,对于早期癌症治愈率较高,癌细胞转移后治愈率较低;早发现早治疗是当下最佳的治疗手段;基因检测是一种无损的检测方法,通过新一代测序技术同时检测成千上万个基因位点,并在大数据下通过对成千上万个基因位点进行数据分析和相关预测,对于临床治疗具有深远的意义,从特征工程、粒计算两个角度对乳腺癌基因大数据进行分析和约简,并通过机器学习分类算法对乳腺癌基因大数据进行分类和预测。
近些年在《乳腺癌NCCN指南》中,对于有家族遗传倾向的乳腺癌高风险人群,推荐用高通量测序进行多基因检测,筛查遗传易感基因,从而预防或指导治疗。这充分显示基于基因检测的个体化治疗及预防是乳腺癌的新方向。指南中指出,对于有家族遗传倾向的乳腺癌高风险人群,《NCCN指南》推荐进行乳腺自检、加强影像学和相应血清肿瘤标志物检查和药物预防等。
通过基因数据的分析帮助医生有效地分析患者是否是乳腺癌高风险患者,然而基因数据过多,亟需一种新的方法能有效地大幅度减少乳腺癌基因数据分类信息中冗余的基因数据,降低乳腺癌数据的分析时间和提高分析效率及精度,有效进行乳腺癌的早期筛查对临床治疗具有一定的意义。
检测主要是用于疾病诊断的采用,基因诊断的方法不仅敏感性大大提高,而且能在短时间内得到结果,了解正确的治疗方法,正确选择药物,避免胡乱用药造成的不良反应,根据乳腺癌基因检测的结果,能够帮助患者制定正确的治疗方法。
发明内容
本发明的目的在于提供一种基于双重自适应邻域半径的多粒度乳腺癌基因分类方法,解决了现有的判断乳腺癌病变状况的有效办法是通过乳腺癌相关的基因数据维度过高难以观察基因突变对于乳腺癌早期判别的影响,通过乳腺癌基因数据之间的联系结合双重自适应邻域半径解决了邻域粗糙集邻域半径选取困难的问题,再利用多粒度邻域粗糙集属性约简可以有效去除噪声和冗余数据。
为了实现上述发明目的,本发明采用以下技术方案:基于双重自适应邻域半径的多粒度乳腺癌基因分类方法,其中,包括以下步骤:
S1:读取乳腺癌基因数据集,将数据转换为一个四元组决策信息系统S=(U,AT,V,f,δ),邻域决策信息系统S表示如下:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南通大学,未经南通大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110845531.0/2.html,转载请声明来源钻瓜专利网。