[发明专利]在线特征库的构建方法、装置和电子设备在审
申请号: | 202110952910.X | 申请日: | 2021-08-19 |
公开(公告)号: | CN113850271A | 公开(公告)日: | 2021-12-28 |
发明(设计)人: | 谢奕;张阳;周炜;杨双全 | 申请(专利权)人: | 北京百度网讯科技有限公司 |
主分类号: | G06K9/46 | 分类号: | G06K9/46 |
代理公司: | 北京同立钧成知识产权代理有限公司 11205 | 代理人: | 朱颖;臧建明 |
地址: | 100085 北京市*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 在线 特征 构建 方法 装置 电子设备 | ||
本公开公开了一种在线特征库的构建方法、装置和电子设备,涉及数据生产、大数据、云服务等人工智能技术领域。具体方案:构建在线特征库时,先确定待存储的特征的更新频率;更新频率包括第一更新频率和第二更新频率,且第一更新频率高于第二更新频率;并根据更新频率,分别确定用于存储基于第一更新频率更新的特征的第一特征库、和用于存储基于第二更新频率更新的特征的第二特征库;第一特征库的更新速率高于第二特征库的更新速率,且第二特征库的存储空间大于第一特征库的存储空间;这样通过第一特征库可以满足更新速率较高的需求,提高了在线特征库的存储效率,通过第二特征库可以满足存储空间较大的需求,解决了在线特征库存储空间不足的问题。
技术领域
本公开涉及数据处理技术领域,尤其涉及一种在线特征库的构建方法、装置和电子设备,具体涉及数据生产、大数据、云服务等人工智能技术领域。
背景技术
随着网络数据量的不断增大,如何从海量数据中获取重要信息是各行各业人员必备的一种技能。
鉴于现有的人工智能算法依赖于从数据中抽取的特征,且抽取的特征对于数据挖掘具有非常重要的意义,因此,在从海量数据中获取重要信息后,可以进一步从重要信息中抽取特征,并对抽取到的特征进行存储,以便后续使用该抽取到的特征。
因此,如何构建用于存储特征的在线特征库是至关重要的。
发明内容
本公开提供了一种在线特征库的构建方法、装置和电子设备。
根据本公开的第一方面,提供了一种在线特征库的构建方法,该在线特征库的构建方法可以包括:
确定待存储的特征的更新频率;其中,所述更新频率包括第一更新频率和第二更新频率,且所述第一更新频率高于所述第二更新频率。
根据所述更新频率,分别确定第一特征库和第二特征库;其中,所述第一特征库用于存储基于所述第一更新频率进行更新的特征,所述第二特征库用于存储基于所述第二更新频率进行更新的特征;所述第一特征库的更新速率高于所述第二特征库的更新速率,且所述第二特征库的存储空间大于所述第一特征库的存储空间。
基于所述第一特征库和所述第二特征库,构建用于存储所述特征的在线特征库。
根据本公开的第二方面,提供了一种特征的在线存储方法,该特征的在线存储方法可以包括:
确定待存储特征的更新频率。
根据所述更新频率,从在线特征库中确定与所述更新频率对应的目标特征库。
将所述待存储特征存储至所述目标特征库。
根据本公开的第三方面,提供了一种在线特征库的构建装置,该在线特征库的构建装置可以包括:
确定单元,用于确定待存储的特征的更新频率;其中,所述更新频率包括第一更新频率和第二更新频率,且所述第一更新频率高于所述第二更新频率。
处理单元,用于根据所述更新频率,分别确定第一特征库和第二特征库;其中,所述第一特征库用于存储基于所述第一更新频率进行更新的特征,所述第二特征库用于存储基于所述第二更新频率进行更新的特征;所述第一特征库的更新速率高于所述第二特征库的更新速率,且所述第二特征库的存储空间大于所述第一特征库的存储空间。
第一构建单元,用于基于所述第一特征库和所述第二特征库,构建用于存储所述特征的在线特征库。
根据本公开的第四方面,提供了一种特征的在线存储装置,该特征的在线存储装置可以包括:
确定单元,用于确定待存储特征的更新频率。
处理单元,用于根据所述更新频率,从在线特征库中确定与所述更新频率对应的目标特征库。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京百度网讯科技有限公司,未经北京百度网讯科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110952910.X/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种智能乐器
- 下一篇:多Kubernetes集群的业务部署方法及装置