[发明专利]一种基于离线和在线聚类的车型数据库清洗方法在审
申请号: | 201810941282.3 | 申请日: | 2018-08-17 |
公开(公告)号: | CN109189771A | 公开(公告)日: | 2019-01-11 |
发明(设计)人: | 尚凌辉;张兆生;王弘玥;余天明 | 申请(专利权)人: | 浙江捷尚视觉科技股份有限公司 |
主分类号: | G06F16/215 | 分类号: | G06F16/215;G06K9/62;G06N20/00 |
代理公司: | 杭州奥创知识产权代理有限公司 33272 | 代理人: | 王佳健 |
地址: | 311121 浙江省杭州市*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开了一种基于离线和在线聚类的车型数据库清洗方法。本发明首先标注各类车型样本得到离线车型库,利用深度学习进行训练,取训练反向第二个的全连接层输出作为车型特征。其次分别提取各个类内所有车型特征进行离线聚类,得到n个类中心及相应阈值。然后定期提取在线车型库各个类内所有车型特征进行聚类,初始聚类中心为离线聚类得到的n个类中心,添加一个随机初始化中心的类后进行有约束的聚类,得到n+1类。最后根据离线聚类得到的阈值,依次判定并清洗属于前n类的车型数据,清洗最后一类车型数据。本发明可以在保持在线车型库内各类整体性质不变的情况下,有效删除错误入库的样本,从而维持系统长期运行的性能及稳定性。 | ||
搜索关键词: | 离线 车型 聚类 车型特征 清洗 车型数据 在线聚类 样本 数据库 初始聚类中心 随机初始化 长期运行 维持系统 整体性质 连接层 标注 判定 删除 入库 输出 学习 | ||
【主权项】:
1.一种基于离线和在线聚类的车型数据库清洗方法,其特征在于该方法包括以下步骤:一.标注各类车型样本得到离线车型库,利用深度学习进行训练,取训练反向第二个的全连接层输出作为车型特征;二.分别提取各个类内所有车型特征进行离线聚类,得到n个类中心及相应阈值;三.定期提取在线车型库各个类内所有车型特征进行聚类,初始聚类中心为离线聚类得到的n个类中心,添加一个随机初始化中心的类后进行有约束的聚类,得到n+1类;四.根据离线聚类得到的阈值,依次判定并清洗属于前n类的车型数据,清洗最后一类车型数据。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于浙江捷尚视觉科技股份有限公司,未经浙江捷尚视觉科技股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201810941282.3/,转载请声明来源钻瓜专利网。