[发明专利]一种数据处理方法、装置以及设备在审
申请号: | 202110653902.5 | 申请日: | 2021-06-11 |
公开(公告)号: | CN115470235A | 公开(公告)日: | 2022-12-13 |
发明(设计)人: | 王俊捷;阙鸣健;郑渊悦 | 申请(专利权)人: | 华为技术有限公司 |
主分类号: | G06F16/245 | 分类号: | G06F16/245;G06F16/28 |
代理公司: | 北京同达信恒知识产权代理有限公司 11291 | 代理人: | 黄冠雄 |
地址: | 518129 广东*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 数据处理 方法 装置 以及 设备 | ||
1.一种数据处理的方法,其特征在于,所述方法包括:
加速装置获取处理器的数据处理请求,其中,所述加速装置和所述处理器设置在第一设备中,所述处理器和所述加速装置通过快捷外围部件互连标准PCIe相连,所述数据处理请求用于实现数据库中第一数据集的格式转换,所述第一数据集包括至少一个数据;
所述加速装置根据所述数据处理请求获取第一数据集,所述第一数据集以第一方式存储;
所述加速装置根据第二方式对所述第一数据集进行格式转换,获得第二数据集,并将所述第二数据集存储至目标存储空间,所述第二数据集以第二方式存储,所述第二数据集包括至少一个数据,所述第二方式与所述第一方式不同。
2.根据权利要求1所述的方法,其特征在于,所述第一方式和所述第二方式分别为行存储或列存储,所述行存储用于指示在所述数据库中以行为准存储数据,所述列存储用于指示在所述数据库中以列为准存储数据。
3.根据权利要求2所述的方法,其特征在于,当所述第一方式为行存储,所述第二方式为列存储时,所述加速装置根据第二格式将所述第一数据集进行转换,获得第二数据集,包括:
所述加速装置获取所述第一数据集中定长字段下的各个数据,将所述各个数据连续排布,生成所述第二数据集,所述第二数据集还包括空值指示信息,所述空值指示信息用于指示所述定长字段下的数据为空值或为非空值。
4.根据权利要求2所述的方法,其特征在于,当所述第一方式为行存储,所述第二方式为列存储时,所述加速装置根据第二格式将所述第一数据集进行转换,获得第二数据集,包括:
所述加速装置获得所述第一数据集中变长字段的各个数据,将所述各个数据连续排布,生成所述第二数据集,所述第二数据集还包括位置指示信息,所述位置指示信息用于指示所述变长字段下的各个数据在所述第二数据集中的位置。
5.根据权利要求3或4所述的方法,其特征在于,所述方法还包括:
所述加速装置对所述第一数据集中数据进行数据格式转换,生成所述第二数据集,其中,所述第一数据集中数据的数据格式为存储数据所需的数据格式,所述第二数据集的数据格式为所述处理器进行数据计算所需的数据格式。
6.如权利要求5所述的方法,其特征在于,所述第一数据集包括数据类型为小数decimal类型的数据,所述方法还包括:
所述加速装置获取所述小数类型的数据的数据描述信息,将所述数据描述信息作为所述第二数据的一部分,所述数据描述信息包括:符号sign、精度precision、范围scale;
所述加速装置根据所述精度和所述范围对所述小数类型的数据进行补位操作或去位操作。
7.如权利要求5所述的方法,其特征在于,所述第一数据集包括数据类型为日期date类型的数据,所述方法还包括:
所述加速装置对所述日期类型的数据进行分解,获取多个子数据,一个所述子数据表征所述年、月、日中的一个,所述多个子数据在所述第二数据中连续排布。
8.如权利要求1~7中任一项所述的方法,其特征在于,所述加速装置为系统级芯片SOC、现场可编程逻辑门阵列FPGA、图像处理器GPU、专用集成电路ASIC、人工智能AI芯片或数据处理器DPU中的至少一种。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华为技术有限公司,未经华为技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110653902.5/1.html,转载请声明来源钻瓜专利网。
- 上一篇:数据处理方法和系统
- 下一篇:通信方法,装置及可读存储介质