[发明专利]一种随机森林哈希的医学CT图像存储与检索方法有效
申请号: | 201810757397.7 | 申请日: | 2018-07-11 |
公开(公告)号: | CN109166615B | 公开(公告)日: | 2021-09-10 |
发明(设计)人: | 曾宪华;周萌 | 申请(专利权)人: | 重庆邮电大学 |
主分类号: | G16H30/00 | 分类号: | G16H30/00;G06F16/51;G06F16/13 |
代理公司: | 重庆市恒信知识产权代理有限公司 50102 | 代理人: | 刘小红;陈栋梁 |
地址: | 400065 重*** | 国省代码: | 重庆;50 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 随机 森林 医学 ct 图像 存储 检索 方法 | ||
本发明请求保护一种随机森林哈希学习的医学CT图像高效存储与检索的方法,具体是通过在医学CT图像集上训练得到随机森林哈希模型,保存模型及图像库对应的哈希码库。当用户输入一张需要检索的新的图像时,首先,模型将该图像映射为哈希码;然后在哈希码库中检索与之最近的K个哈希码;最后,将这个K个哈希码利用树的决策路径所定义的最大相容规则解码重构为图像并返回给用户。该方法的实现,有效地提高了图像检索的速度,并且极大地节省了图像的存储空间,有助于医生的医学诊断,减少医生的工作量,提高工作效率,提升医院存储设备的利用率。
技术领域
本发明属于医学图像处理领域,尤其涉及医学CT图像存储与检索方法技术。
背景技术
大数据时代数据量大幅度增加,现代信息技术的基础设施必须能够处理巨大的数据,由此造成的存储、传输、管理等成本随之增加。事实上,与这些成本相比,在大型数据库中搜索相关内容变得更具挑战性。尤其是搜索诸如音频、图像和视频之类的媒体数据仍然是一个主要的挑战。除了广泛使用的基于文本的商业搜索引擎,如:谷歌、百度和必应,基于内容的图像检索在过去十年中引起了广泛的关注。基于内容的图像检索无需依赖基于文本关键字的索引结构,直接对媒体内容进行有效的索引,以便直接响应视觉查询。
在给定数据库中搜索类似的数据样本与最近邻搜索问题相关。高维数据检索本质上可以转换为最近邻查找问题,即给定一个分布在高维空间内的数据集和一个检索样例,在高维空间中返回与检索样例距离最近的数据或与之最接近的前K个数据。将查询点与数据库中的每个样本彻底比较是不可行的,因为线性时间复杂度在现实的大规模应用中往往是不可取的。除了不可扩展外,由于数据通常包含数千甚至数万个维度,所以在实际中的大规模应用也会受到数据维度的限制。因此,除了穷举搜索的计算成本的太大,将原始数据加载到存储器中占用的空间过大也是一个关键问题。
对于高维数据的处理,哈希索引技术能够表现出良好性能,近年来受到越来越多的研究者的关注。哈希方法通过学得一组哈希函数将原始特征映射为紧凑二进制哈希码,使得哈希码尽可能的保持原始空间中的近邻关系,即保持相似性。以图像数据为例,两张内容相近的图像经过哈希编码后,哈希码尽可能保持一致,而内容差别较大的图像经过哈希编码后,哈希码尽可能的不相同。并且哈希方法能够通过使用查找表或者基于排名的汉明距离实现快速的搜索。事实上,在汉明空间中计算索引样例与数据库中所有的样本之间的汉明距离也可以很迅速地完成。在汉明空间内进行近邻查找,一般使用遍历的方法将待检索的图像与图像库中的所有图像对比计算汉明距离。两个数据之间的汉明距离可以直接用计算机硬件通过“异或”操作实现,这样计算千万数量级数据的汉明距离所需的时间只在毫秒级。紧凑的二进制代码对于大规模的数据存储也非常有效。哈希学习方法通过机器学习机制将数据映射成二进制串的形式,能显著减少数据的存储和通信开销,从而有效提高学习系统的效率。
然而,现有的哈希学习技术应用在图像检索中时,需要保存原始图像库,检索过程仍然需要利用到原始图像库,没有彻底地减少数据的存储空间。
发明内容
本发明旨在解决以上现有技术的问题。提出了一种提高检索准确性与检索速度,提高存储设备的利用率的方法。本发明的技术方案如下:
一种随机森林哈希的医学CT图像存储与检索方法,其包括以下步骤:
获取若干医学CT图像并作为训练集,计算所有医学CT图像的标签相似度和流形相似度,标签相似度直接根据图像的标签构建标签相似矩阵,流形相似度根据图像之间的欧氏距离定义相似度;
根据求得的标签相似矩阵,将所有图像分块,标签一致的图像分在一个块中;对于每一个块中的图像,利用流形相似度作为边的权值构建图,使用图分割算法为块中的所有图像初始化一位哈希码;将初始化的哈希码作为标签训练随机森林模型,模型的结果更新初始的哈希码;重复直到达到预设的哈希码位数;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于重庆邮电大学,未经重庆邮电大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810757397.7/2.html,转载请声明来源钻瓜专利网。