[发明专利]一种基于朴素贝叶斯的医疗影像疾病分类方法有效
申请号: | 201410171212.6 | 申请日: | 2014-04-25 |
公开(公告)号: | CN103955703A | 公开(公告)日: | 2014-07-30 |
发明(设计)人: | 徐哲;洪嘉鸣;霍洪波;何必仕 | 申请(专利权)人: | 杭州电子科技大学 |
主分类号: | G06K9/62 | 分类号: | G06K9/62 |
代理公司: | 杭州求是专利事务所有限公司 33200 | 代理人: | 杜军 |
地址: | 310018 浙*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 朴素 贝叶斯 医疗 影像 疾病 分类 方法 | ||
技术领域
本发明涉及医疗影像疾病分类领域,具体涉及一种基于朴素贝叶斯的医疗影像疾病分类方法。
背景技术
随着数字化医院的建设,大型医院长年积累了海量的医疗文本信息,面对这浩如烟海的文本数据,如何快速检索发现有用的信息、多角度利用这些文本和有效的对这些信息进行归类整理,进而挖掘出隐含的、有用的医疗知识和经验便显得尤为迫切。因此研究自动分类、聚类技术来改进传统的数据库结构化查询有着十分重要的意义。
文本分类和聚类是文本信息处理领域的一个重要分支,其目标就是研究如何更有效地组织和管理文本信息,并快速、准确、全面地从中找到、分流、定位和形成用户所需要的信息。文本分类和聚类作为获取和组织大量文本数据的关键技术,可以在很大程度上解决信息杂乱和信息爆炸的问题。
聚类分析是按照一定的度量规则将数据集合进行划分,以此形成若干聚类簇。目的是使得在同一个簇中的数据或属性具有较大的相似程度,而不同簇之间相似程度低。K-Means聚类算法是一种基于划分的聚类算法,尝试找出使得平方误差函数值最小的K个划分,当簇与簇之间的特征区别比较明显时,并且结果簇是密集的,K-Means聚类结果的效果较好。K-Means聚类算法的优点主要集中在:算法快速、简单;对大数据集有较高的效率并且是可伸缩性的。
朴素贝叶斯分类作为一类基于概率统计知识的分类方法,可以与基于决策树和神经网络的分类方法相媲美,且该方法较简单、准确率高、分类过程中时间空间开销小,非常适合运用于医疗影像数据库等大型数据库中。
目前,对于医疗影像疾病的分类,主要采用RIS/PACS系统所提供的基本分类功能,但其并非自动分类,而需要影像科医生及时对医疗影像进行分类。由于缺乏合适的医疗影像检查结果自动分类技术,一方面给影像科医生增加了工作负担;另一方面,给医生科研检索带来诸多不便。为此,本发明结合基于朴素贝叶斯分类方法简单,准确率高,时间空间开销小等优点,提出一种基于朴素贝叶斯的医疗影像疾病自动分类方法。
发明内容
针对医疗影像检查报告不能被及时进行分类,从而对医生科研检索带来诸多不便的问题,利用朴素贝叶斯算法简单,高效,稳定性强且有较好的精确度等优点,本发明提出一种基于朴素贝叶斯的医疗影像疾病分类方法,以解决上述技术问题。
疾病自动分类具体内容:根据设备类型和诊断报告表中的影像所见、诊断结论等文本信息,自动判断影像检查结果所属的疾病类型。考虑到朴素贝叶斯分类的独立性假设在实际应用中的影响,本发明采用K-Means聚类算法进行疾病聚类分析,将相似程度高的数据划分到同一簇中,相似程度低的数据划分到不同簇中,同时确定疾病类别数量。
本发明方法具体是:
步骤1:首先利用机器学习方法,从医疗影像信息系统的数据报告表中提取10000数量的检查记录;使用K-Means聚类算法进行疾病聚类分析,确定十个疾病类别。K-Means聚类算法的目的是将一些数据矢量划分至类别数目已知的聚类中。
具体的说,K-Means聚类算法进行疾病聚类分析包括以下步骤:
1)从待分类数据记录X中任意选取K个数据记录作为初始簇类中心C={c1,c2,…,ck},令K=10;待分类数据记录X={a1,a2,…,an},ai表示待分类数据记录X的一个特征向量,X的维数是N维。
2)计算d(xi,Cj),d为待分类数据记录xi到类Cj的距离,并把具有最小值d(xi,Cj)的数据点xi划分到类Cj中,引进N维向量Uj作为类Cj的中心。
3)计算类Cj的中心点,通过计算类Cj中每个点的坐标平均值获得,即Uj。
4)如果每个数据记录X与它类中心点Uj的距离平方和最小,则符合条件,则停止该算法并返回最后结果C;否则将Uj(1≤j≤10)作为新的10个簇类中心,并返回1-2)。
通过K-Means聚类算法获得十个疾病类型后,借助国际疾病类型分类标准ICD-10将这十个类别进行疾病类型确定和编码。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于杭州电子科技大学,未经杭州电子科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201410171212.6/2.html,转载请声明来源钻瓜专利网。