[发明专利]兴趣点分析方法及装置在审
申请号: | 202110439930.7 | 申请日: | 2021-04-23 |
公开(公告)号: | CN113033560A | 公开(公告)日: | 2021-06-25 |
发明(设计)人: | 聂砂;罗奕康;戴菀庭;郭赜;王典;李萌;王伊妍;刘海;贾国琛 | 申请(专利权)人: | 中国建设银行股份有限公司 |
主分类号: | G06K9/32 | 分类号: | G06K9/32;G06N3/04;G06N3/08 |
代理公司: | 北京三友知识产权代理有限公司 11127 | 代理人: | 贾磊;李辉 |
地址: | 100033 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 兴趣 分析 方法 装置 | ||
本发明公开了一种兴趣点分析方法及装置,涉及数据处理技术领域,其中,该方法包括:获得出行轨迹记录数据;对所述出行轨迹记录数据进行次数压缩处理;将次数压缩处理后的出行轨迹记录数据进行编码,得到对应的数字序列;将所述数字序列输入预先建立的word2vec神经网络模型进行训练,确定训练好的所述word2vec神经网络模型的权重矩阵;根据所述权重矩阵,进行兴趣点分析。本发明能够解决现有兴趣点分析方法存在数据量过大,时间复杂度过高的问题。
技术领域
本发明涉及数据处理技术领域,尤其涉及一种兴趣点分析方法及装置。
背景技术
本部分旨在为权利要求书中陈述的本发明实施例提供背景或上下文。此处的描述不因为包括在本部分中就承认是现有技术。
用户行为是具有关联性的,通过用户一段时间去过的地点序列,获取地点之间的关联性,可以得到一个地点的用户会去的以及去过的可能地点。这就是目前一个非常热门的研究课题兴趣点(Point of Interest,简称POI)分析。
现有技术中通常统计关注事件组在全量数据中发生的次数,例如,1000个用户中有100个用户一段时间内都去过医院和药店,则(医院,药店)的频次为100,如果此时(医院,甜品店)的频次为20,可以得出药店相比于甜品店和医院更相关。考虑事物发生的时序性时,则需保留整条时间上的行为链。但是这种方法存在数据量过大,时间复杂度过高的问题。
针对上述问题,目前尚未提出有效的解决方案。
发明内容
本发明实施例中提供了一种兴趣点分析方法,用以解决现有兴趣点分析方法存在数据量过大,时间复杂度过高的问题,该方法包括:
获得出行轨迹记录数据;
对所述出行轨迹记录数据进行次数压缩处理;
将次数压缩处理后的出行轨迹记录数据进行编码,得到对应的数字序列;
将所述数字序列输入预先建立的word2vec神经网络模型进行训练,确定训练好的所述word2vec神经网络模型的权重矩阵;
根据所述权重矩阵,进行兴趣点分析。
进一步地,出行轨迹记录数据包括:地点经纬度信息。
进一步地,对所述出行轨迹记录数据进行次数压缩处理,包括:
利用shrink函数对所述出行轨迹记录数据中重复的部分进行次数压缩处理。
进一步地,所述shrink函数为:对数函数向下取整。
进一步地,所述的兴趣点分析方法,还包括:
按预设窗口长度对所述数字序列进行取窗口处理;
将所述数字序列输入预先建立的word2vec神经网络模型进行训练,包括:将进行取窗口处理的数字序列输入预先建立的word2vec神经网络模型进行训练。
进一步地,所述word2vec神经网络模型包括:CBOW模型或LSTM模型。
进一步地,根据所述权重矩阵,进行兴趣点分析,包括:
根据所述权重矩阵,确定每个地点对应的向量;
根据所述向量,确定向量夹角数据;
根据所述向量夹角数据,进行兴趣点分析。
本发明实施例中提供了一种兴趣点分析装置,用以解决现有兴趣点分析方法存在数据量过大,时间复杂度过高的问题,该装置包括:
数据获得模块,用于获得出行轨迹记录数据;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国建设银行股份有限公司,未经中国建设银行股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110439930.7/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种防溢锅盖
- 下一篇:一种电气设备局部放电故障现场检测与定位装置及方法