[发明专利]数据处理方法及数据处理系统有效
申请号: | 201711415016.9 | 申请日: | 2017-12-22 |
公开(公告)号: | CN108053407B | 公开(公告)日: | 2021-04-13 |
发明(设计)人: | 姜譞 | 申请(专利权)人: | 联想(北京)有限公司 |
主分类号: | G06T7/10 | 分类号: | G06T7/10 |
代理公司: | 中科专利商标代理有限责任公司 11021 | 代理人: | 周天宇 |
地址: | 100085 北京市*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 数据处理 方法 数据处理系统 | ||
本公开提供了一种数据处理方法,包括:获取至少一个标注结果,其中,至少一个标注结果中的每个为对应用户给图像中的对象标注数据形成的;以及基于至少一个标注结果和图像,评价对应用户的标注水平。本公开提供的数据处理方法,利用获取的至少一个用户给图像中的对象标注数据形成的的至少一个标注结果,评价用户的标注水平,在大数据背景下采用一种基于人工智能的深度学习方法,至少部分地克服了相关技术中评价标注水平需要耗费较高成本的技术问题,实现对标注水平的自动评价,并实时的输出对标注水平的评价分数的技术效果。此外,本公开还提供了一种数据处理系统。
技术领域
本公开涉及一种数据处理方法及数据处理系统。
背景技术
利用人工智能和深度学习方法,可以自动分割出图像中的对象。如在医疗领域,可以自动的分割出计算机体层摄影(Computed Tomography,简称为CT)图像中的器官,甚至是存在于器官上的病灶组织。而深度学习模型的训练依赖于医生在CT图像中标注好的数据,换言之,医生的标注水平在很大程度上决定了训练出的模型的质量水平。
在实现本公开实施例的过程中,发明人发现相关技术中至少存在如下问题:对医生的标注水平进行评价需要耗费较高的成本。
针对相关技术中的上述问题,目前还未提出有效的解决方案。
发明内容
鉴于此,本公开提供了一种数据处理方法及数据处理系统。
本公开的一个方面提供了一种数据处理方法,包括:获取至少一个标注结果,其中,上述至少一个标注结果中的每个为对应用户给图像中的对象标注数据形成的;以及基于上述至少一个标注结果和上述图像,评价上述对应用户的标注水平。
可选地,基于上述至少一个标注结果和上述图像,评价上述对应用户的标注水平包括:确定上述至少一个标注结果中各标注结果的初始权重值;根据上述初始权重值和上述各标注结果,确定与上述至少一个标注结果对应的期望标注数据;基于上述期望标注数据和上述图像,确定用于评价上述对应用户的标注水平的期望分割结果;以及以上述期望分割结果为参照,评价上述对应用户的标注水平。
可选地,基于上述期望标注数据和上述图像,确定用于评价上述对应用户的标注水平的期望分割结果包括:加载用于图像分割的初始模型;将上述期望标注数据输入上述初始模型以训练出用于图像分割的目标模型;以及将上述期望标注数据和上述图像输入上述目标模型,以输出用于评价上述对应用户的标注水平的期望分割结果。
可选地,以上述期望分割结果为参照,评价上述对应用户的标注水平包括:依次比较上述期望分割结果和上述至少一个标注结果中各标注结果的差异;根据差异比较结果,更新上述至少一个标注结果中各标注结果的上述初始权重值,以获得上述各标注结果的目标权重值;以及根据上述目标权重值,评价与上述各标注结果对应的用户的标注水平。
可选地,上述方法还包括:根据上述目标权重值和上述各标注结果,重新确定与上述至少一个标注结果对应的期望标注数据。
本公开的另一个方面提供了一种数据处理系统,包括:获取模块,用于获取至少一个标注结果,其中,上述至少一个标注结果中的每个为对应用户给图像中的对象标注数据形成的;以及评价模块,用于基于上述至少一个标注结果和上述图像,评价上述对应用户的标注水平。
可选地,评价模块包括:第一确定单元,用于确定上述至少一个标注结果中各标注结果的初始权重值;第二确定单元,用于根据上述初始权重值和上述各标注结果,确定与上述至少一个标注结果对应的期望标注数据;第三确定单元,用于基于上述期望标注数据和上述图像,确定用于评价上述对应用户的标注水平的期望分割结果;以及评价单元,用于以上述期望分割结果为参照,评价上述对应用户的标注水平。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于联想(北京)有限公司,未经联想(北京)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201711415016.9/2.html,转载请声明来源钻瓜专利网。