[发明专利]数据对象的聚类、数据处理及数据识别方法有效
申请号: | 201810253522.0 | 申请日: | 2018-03-26 |
公开(公告)号: | CN110363206B | 公开(公告)日: | 2023-06-27 |
发明(设计)人: | 樊珈珮 | 申请(专利权)人: | 阿里巴巴集团控股有限公司 |
主分类号: | G06F16/35 | 分类号: | G06F16/35;G06F18/23213;G06F40/216;G06F40/284 |
代理公司: | 北京君以信知识产权代理有限公司 11789 | 代理人: | 谭镇 |
地址: | 英属开曼群岛大开*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 数据 对象 数据处理 识别 方法 | ||
本申请实施例提供了一种数据对象的聚类、数据处理及数据识别方法。所述数据对象的聚类方法包括:确定数据对象中与数据对象属性对应的数据元素,获取所述数据对象的第一特征信息,所述第一特征信息根据所述数据元素的第二特征信息确定,根据所述第一特征信息对所述数据对象进行聚类处理。本申请能够准确地对数据对象进行聚类,提高了对数据对象进行聚类的准确性和效率。
技术领域
本申请涉及数据处理技术领域,特别是涉及一种数据对象的聚类、数据处理及数据识别方法。
背景技术
随着生活和生产的自动化程度的不断提高,在各方面的应用中,需要通过计算机等机器进行数据处理的数据对象的种类和数目也越来越多,比如,电子商城中的各商品、多媒体网站中的多媒体节目或社交网站中的用户发帖等。由于不同的数据对象可能具有不同的特征,因此在数据处理过程中,为了按照不同数据对象所具有的特征对数据对象进行管理或处理,需要按照数据对象所具有的特征,对数据对象进行种类划分,即对数据对象进行聚类。
现有技术中,通常可以事先针对数据对象确定多个种类,由用户或相关技术人员按照不同的种类对数据对象进行标记,从而将数据对象划分为不同的种类。但由于需要依赖用户或相关技术人员对数据对象的主观经验,对数据对象进行标记,难以满足对大量数据对象进行分类的需求,分类效率和准确性低下。
发明内容
鉴于上述问题,提出了本申请以便提供一种克服上述问题或者至少部分地解决上述问题的数据对象的聚类、数据处理及数据识别方法。
本申请提供了一种数据对象的聚类方法,包括:
确定数据对象中与数据对象属性对应的数据元素;
获取所述数据对象的第一特征信息,所述第一特征信息根据所述数据元素的第二特征信息确定;
根据所述第一特征信息对所述数据对象进行聚类处理。
可选的,所述确定数据对象中与数据对象属性对应的数据元素包括:
识别所述数据对象对应的数据结构,所述数据结构由至少一种数据对象属性构成;
按照所述数据结构,确定所述数据对象中与所述数据对象属性对应的数据元素。
可选的,在所述确定数据对象中与数据对象属性对应的数据元素之前,所述方法还包括:
对所述数据对象进行分词;
所述按照所述数据结构,确定所述数据对象中与所述数据对象属性对应的数据元素包括:
按照所述数据结构,确定所述数据对象中与所述数据对象属性对应的至少一个分词,作为与所述数据对象属性对应的数据元素。
可选的,所述识别所述数据对象对应的数据结构包括:
采用数据结构识别模型识别所述数据对象对应的数据结构。
可选的,所述方法还包括:
根据标记有数据结构的数据对象样本生成所述数据结构识别模型。
可选的,所述获取所述数据对象的第一特征信息包括:
确定所述数据对象包括的数据元素对应的元素权重;
根据所述数据元素的元素权重和所述第二特征信息,确定所述数据对象的第一特征信息。
可选的,在所述获取所述数据对象的第一特征信息之前,所述方法还包括:
获取所述数据元素的第二特征信息。
可选的,所述数据元素包括至少一个分词,所述获取所述数据元素的第二特征信息包括:
确定所述至少一个分词的第三特征信息;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于阿里巴巴集团控股有限公司,未经阿里巴巴集团控股有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810253522.0/2.html,转载请声明来源钻瓜专利网。
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置