[发明专利]一种车型参配信息的聚类方法,装置及系统在审
申请号: | 201710905252.2 | 申请日: | 2017-09-29 |
公开(公告)号: | CN110020286A | 公开(公告)日: | 2019-07-16 |
发明(设计)人: | 刘迪;邱慧;孟昭伯;柴明;解鹏飞;韩晓璇 | 申请(专利权)人: | 车伯乐(北京)信息科技有限公司 |
主分类号: | G06F16/957 | 分类号: | G06F16/957;G06F16/35 |
代理公司: | 北京弘权知识产权代理事务所(普通合伙) 11363 | 代理人: | 逯长明;许伟群 |
地址: | 100020 北京市朝阳*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 参配 车型 装置及系统 车辆信息 聚类 品牌 切割 存储数据库 标准模板 聚类系统 内容结构 内容聚类 信息符合 自动提取 自动抓取 比对 申请 网页 汽车 统一 | ||
1.一种车型参配信息的聚类方法,其特征在于,包括:
分别获取车辆官网中的每个车辆对应的车辆信息;
切割所述车辆信息,生成车型参配信息碎片集,所述车型参配信息集包括至少一个车型参配信息碎片;
将满足标准模板的车型参配信息碎片,聚类到相应的标准项中进行显示。
2.根据权利要求1所述的方法,其特征在于,所述将满足标准模板的车型参配信息碎片,聚类到相应的标准项中进行显示的步骤包括:
判断所述车型参配信息碎片是否满足标准模板;
如果所述车型参配信息碎片满足标准模板,将所述车型参配信息聚类到相应的标准项中进行显示;
如果所述车型参配信息碎片不满足标准模板,解析所述车型参配信息碎片,将解析后的车型参配信息碎片转换为解析文本,所述解析文本满足标准模板;
将解析文本聚类到相应的标准项中进行显示。
3.根据权利要求1所述的方法,其特征在于,所述将满足标准模板的车型参配信息碎片,聚类到相应的标准项中进行显示的步骤包括:
判断是否存在与所述车型参配信息碎片相对应的标准项;
如果存在与所述车型参配信息碎片相对应的标准项,将所述车型参配信息碎片聚类到相应的标准项中进行显示;
如果不存在与所述车型参配信息碎片相对应的标准项,提取所述车型参配信息碎片的关键字;
根据所述关键字,生成所述车型参配信息碎片对应的亮点标准项;
将所述车型参配信息碎片聚类到所述亮点标准项进行显示。
4.根据权利要求1所述的方法,其特征在于,所述分别获取车辆官网中的每个车辆对应的车辆信息的步骤包括:
获取车辆官网中每个网页上的车辆信息,如果所述车辆信息重复出现,只获取一次所述车辆信息。
5.根据权利要求1所述的方法,其特征在于,所述分别获取车辆官网中的每个车辆对应的车辆信息的步骤包括:
获取车辆官网中每个网页上的网页信息;
判断所述网页信息是否为车型参配信息;
如果所述网页信息不是车型参配信息,将所述网页信息删除;
如果所述网页信息是车型参配信息,存储所述车型参配信息。
6.根据权利要求1所述的方法,其特征在于,所述分别获取车辆官网中的每个车辆对应的车辆信息的步骤包括:
获取车辆官网中每个网页上的网页信息,以及,所述网页信息对应的链接;
计算所述链接对应的响应页面的信息与所述网页信息之间的相似度;
如果所述相似度小于相似度阈值,删除产生所述链接的网页信息;
如果所述相似度大于或等于相似度阈值,确定产生所述链接的网页信息为车辆信息。
7.根据权利要求1所述的方法,其特征在于,所述车型参配信息包括:文字信息和/或图片信息。
8.一种车型参配信息的聚类装置,其特征在于,包括:
信息获取单元,用于分别获取车辆官网中的每个车辆对应的车辆信息;
切割单元,用于切割所述车辆信息,生成车型参配信息碎片集;
聚类单元,用于将满足标准模板的车型参配信息碎片,聚类到相应的标准项中进行显示。
9.根据权利要求8所述的装置,其特征在于,所述聚类单元包括:
第一判断单元,用于判断所述车型参配信息碎片是否满足标准模板;
第一显示单元,用于将所述车型参配信息聚类到相应的标准项中进行显示;
解析单元,用于解析所述车型参配信息碎片,将解析后的车型参配信息碎片转换为解析文本,所述解析文本满足标准模板;
第二显示单元,用于将解析文本聚类到相应的标准项中进行显示。
10.一种车型参配信息的聚类系统,包括:应用平台服务器,与所述应用平台服务器相连接的数据存储服务器,所述数据存储服务器设置在所述平台服务器内部或独立设置,所述应用平台服务器通过互联网与终端相连接,其特征在于,
所述终端,用于显示车辆的标准项,以及,所述标准项对应的车型参配信息;
所述应用平台服务器,用于分别获取车辆官网中的每个车辆对应的车辆信息;
切割所述车辆信息,生成车型参配信息碎片集,所述车型参配信息集包括至少一个车型参配信息碎片;
将满足标准模板的车型参配信息碎片,聚类到相应的标准项中进行显示;
所述数据存储服务器,用于相关数据的存储。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于车伯乐(北京)信息科技有限公司,未经车伯乐(北京)信息科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710905252.2/1.html,转载请声明来源钻瓜专利网。
- 上一篇:柱状图的处理方法及装置
- 下一篇:网页热力图的加载方法及装置