[发明专利]用于丰富数据的系统和方法在审
| 申请号: | 202080035793.4 | 申请日: | 2020-03-20 |
| 公开(公告)号: | CN113826091A | 公开(公告)日: | 2021-12-21 |
| 发明(设计)人: | E.勒休鲁;M.什切尔巴克 | 申请(专利权)人: | 奥兰治 |
| 主分类号: | G06F16/38 | 分类号: | G06F16/38;G06F16/35 |
| 代理公司: | 北京市柳沈律师事务所 11105 | 代理人: | 李芳华 |
| 地址: | 法国伊西*** | 国省代码: | 暂无信息 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 用于 丰富 数据 系统 方法 | ||
1.一种在计算机装置中实现的用于数据丰富的处理,包括:
a)接收(S1)若干数据集(DAT1、DAT2、DAT3),每个数据集包括基础数据(D1,D2,D3)和与所述基础数据相关的元数据(MD11,MD1m,MD21,MD2n,MD31,MD3p);
b)根据相似性函数(F),基于分别与所述数据集相关联的基础数据,对所述数据集进行分组(S3);
c)用被称为标签的附加数据(label(C1),label(C2),label(C3))丰富(S4)每个数据集,所述标签表征所述数据集所属的组;
d)对于每个经丰富的数据集,在存储数据集的至少一个数据库(DB1,DB2)中搜索(S5)来自所述经丰富的数据集的元数据和标签的至少一部分的组合,每个数据集包括元数据和标签;以及
e)如果来自所述经丰富的数据集的元数据和标签的至少一部分的所述组合不存在于所述至少一个数据库中,则从所述经丰富的数据集移除(S6)所述标签。
2.根据权利要求1所述的处理,其中所述基础数据是字符串、或声音信号或数字图像。
3.根据权利要求1或2所述的处理,还包括在接收到数据集之后:对于每个数据集,通过应用用于降低所述基础数据中的噪声水平的处理,生成(S2)与所述数据集相关联的经处理的数据(D1′,D2′,D3′),
其中数据集的分组是根据分别与所述数据集相关联的经处理的数据来实现的。
4.根据权利要求3所述的处理,其中所述基础数据是字符串,并且通过从所述字符串中消除来自预设字符列表中的一个或多个字符,来生成所述经处理的数据。
5.根据前述权利要求中的一项所述的处理,其中所述数据集的分组使用无监督学习算法。
6.根据前述权利要求中的一项所述的处理,其中存储在所述至少一个数据库中的每个数据集还包括基础数据,并且如果经丰富的数据集的元数据和标签的至少一部分的组合存在于所述至少一个数据库中的对应数据集内,则来自所述经丰富的数据集的基础数据在需要时被来自所述对应数据集的基础数据所取代。
7.根据前述权利要求中的一项所述的处理,其中存储在所述至少一个数据库中的每个数据集还包括基础数据,其中在多个数据库上进行搜索,其中每个数据库由可靠性系数表征,并且,如果来自经丰富的数据集的元数据和标签的至少一部分的组合存在于分别存储在与所述多个数据库不同的数据库中的对应数据集中,则如果来自所述经丰富的数据集的基础数据不同于存储在由最大可靠性系数表征的数据库中的对应数据集的基础数据,则移除所述经丰富的数据集的标签。
8.根据权利要求1至6中的一项所述的处理,其中存储在所述至少一个数据库中的每个数据集还包括基础数据,其中在多个数据库上进行搜索,其中每个数据库由可靠性系数表征,并且,如果来自所述经丰富的数据集的元数据和标签中的至少一部分的组合存在于分别存储在与所述多个数据库不同的数据库中的对应数据集中,则存在于所述对应数据集中的至少一个中的每个基础数据与相似性因子相关联,所述相似性因子是取决于存储包括所述基础数据的对应数据集的每个数据库的可靠性系数来确定的,并且如果来自所述经丰富的数据集的基础数据不同于与最高相似性因子相关联的基础数据,则移除所述经丰富的数据集的标签。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于奥兰治,未经奥兰治许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202080035793.4/1.html,转载请声明来源钻瓜专利网。
- 上一篇:用于上行链路传输的方法、终端设备和网络节点
- 下一篇:能量供应系统
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置





