[发明专利]基于影像资料调用业务场景实现资料冷热分离存储的方法有效
申请号: | 202010004175.5 | 申请日: | 2020-01-03 |
公开(公告)号: | CN111209414B | 公开(公告)日: | 2023-08-11 |
发明(设计)人: | 喻川;陈思成;胡荣德 | 申请(专利权)人: | 四川新网银行股份有限公司 |
主分类号: | G06F16/41 | 分类号: | G06F16/41;G06F16/955;G06N3/0442;G06N3/084 |
代理公司: | 成都智言知识产权代理有限公司 51282 | 代理人: | 蒋秀清 |
地址: | 610094 四川省成都市成都*** | 国省代码: | 四川;51 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 影像 资料 调用 业务 场景 实现 冷热 分离 存储 方法 | ||
1.一种基于影像资料调用业务场景实现资料冷热分离存储的方法,其特征在于,如下步骤:
步骤1、根据应用场景中的埋点技术,实时采集用户行为数据,获取基于用户行为数据提交的影像资料,并判断获取的影像资料是否是首次提交,若不是首次提交,转到步骤2,若是首次提交,存储在热数据区域,再转到步骤2,其中,影像资料为非结构化数据,包括图片、视频和PDF;
步骤1.1、在调取影像资料的应用场景中,用户登录或浏览入口页面时,基于埋点技术会实时产生用户操作行为数据,即用户行为数据,产生后实时地记录用户行为数据,并获取基于用户行为数据提交的影像资料;
步骤1.2、判断获取的影像资料是否是首次提交,即根据标签比对的方法判断当前提交的影像资料是否在临时预热区域、热数据区域或冷数据区域,若不是首次提交,即在临时预热区域、热数据区域或冷数据区域,转到步骤2,若是首次提交,即不在临时预热区域、热数据区域和冷数据区域,存储影像资料在热数据区域,再转到步骤2;其中,标签比对的方法是将影像资料的标签与临时预热区域、热数据区域和冷数据区域中存储的影像资料的标签进行对比;
步骤2、基于当前用户行为数据、历史用户行为数据和训练好的用户行为预测模型,预测用户下一个需要办理的业务;
得到训练好的用户行为预测模型的具体步骤为:
步骤2-1、获取历史用户行为数据,即获取用户的历史地理位置信息、历史当前办理业务、历史下一个需要办理的业务和业务流程先后顺序规则,其中,业务流程先后顺序规则是指在业务办理过程中各业务的先后顺序,以及各业务内调取影像资料的先后顺序;
步骤2-2、将历史地理位置信息、业务流程先后顺序规则做one-hot编码转换处理,处理后映射为向量形式,其中,映射时缺失值以中位数或者均值填充;历史访问页面的URL映射为向量空间,将所有映射的结果构成特征向量,其中,历史访问页面的URL即指历史当前办理业务和历史下一个需要办理的业务;
步骤2-3、基于特征向量训练用户行为预测模型,得到训练后的用户行为模型,其中,用户行为预测模型为LSTM长短时记忆神经网络模型;
步骤3、若下一个需要办理的业务对应的影像资料存储在冷数据区域,则将其调取到临时预热区域,再转到步骤4,若存储在热数据区域,则不做处理;
步骤4、处理下一个需要办理的业务时,临时预热区域内的影像资料被调用,则将临时预热区域内的影像资料移动到热数据区域进行存储,若未被调用,则将其移回冷数据区域进行存储;
还包括影像资料冷热更新,即指每日检测热数据区域中存储的影像资料,判断其是否超过给定的时间阈值、且未被调用,若是,将其判定为冷影像资料,并将此影像资料移动到冷数据区域进行存储,若否,则仍为热影像资料,仍存储在热数据区域,其中,给定的时间阈值为7-30日。
2.根据权利要求1所述的一种基于影像资料调用业务场景实现资料冷热分离存储的方法,其特征在于,所述步骤2-1中,业务流程先后顺序规则包括在授信场景中,业务的先后顺序依次为用户注册到实名认证、申请授信和放款;其中,在用户注册到实名认证中,包括调用身份证影像资料上传、身份证影像资料OCR识别、人脸比对和唇语识别的先后顺序;在申请授信中,调用身份影像资料核查和征信影像资料核查的先后顺序;在放款时,调用各合同影像资料进行审查的先后顺序。
3.根据权利要求2所述的一种基于影像资料调用业务场景实现资料冷热分离存储的方法,其特征在于,所述步骤2的具体步骤为:将用户当前的地理位置信息、当前办理业务、业务流程先后顺序规则和历史用户行为数据输入训练好的用户行为模型,预测到用户下一个需要办理的业务。
4.根据权利要求1所述的一种基于影像资料调用业务场景实现资料冷热分离存储的方法,其特征在于,所述步骤3中的临时预热区域为NAS服务器、内存存储介质、缓存存储介质或缓冲区存储介质中的一种或多种。
5.根据权利要求1或4所述的一种基于影像资料调用业务场景实现资料冷热分离存储的方法,其特征在于,所述冷数据区域为大数据平台HDFS、HBASE存储介质或FileNet存储介质中的一种或多种,热数据区域为高性能存储介质,包括NAS或SSD存储介质中的一种或多种。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于四川新网银行股份有限公司,未经四川新网银行股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010004175.5/1.html,转载请声明来源钻瓜专利网。