[发明专利]移动网络的用户分组在审
| 申请号: | 202080085138.X | 申请日: | 2020-12-03 |
| 公开(公告)号: | CN114868118A | 公开(公告)日: | 2022-08-05 |
| 发明(设计)人: | G.兰科;M.N.S.加西亚;G.道伊尔 | 申请(专利权)人: | 国际商业机器公司 |
| 主分类号: | G06F16/93 | 分类号: | G06F16/93;G06N20/00 |
| 代理公司: | 北京市柳沈律师事务所 11105 | 代理人: | 陈金林 |
| 地址: | 美国纽*** | 国省代码: | 暂无信息 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 移动 网络 用户 分组 | ||
1.一种计算机实现方法,包括:
从移动网络的一个或多个移动网络提供商获取交易数据记录;
基于获得的交易数据记录识别多个用户出现,其中每个用户出现表示相关联的用户在所述移动网络内的时间和位置的出现;
将词嵌入应用于所述多个用户出现,以生成将所述多个用户出现映射到词汇表的词语的词嵌入模型;以及
使用自然语言处理(NLP)算法处理所述词嵌入模型以识别所述移动网络的不同用户之间的关系。
2.根据权利要求1所述的计算机实现的方法,进一步包括:
识别用户出现相对于时间或位置的同现;以及
基于识别的用户出现的同现,训练所述词嵌入和NLP算法中的至少一个。
3.根据权利要求1所述的计算机实现的方法,其中,所述交易数据记录包括数据,所述数据包括指示与给定交易相关联的国际移动用户识别码(IMSI)的信息、所述给定交易的时间数据、以及所述移动网络的单元小区的标识符。
4.根据权利要求1所述的计算机实现的方法,其中,应用词嵌入包括采用word2vec模型来产生词嵌入。
5.根据权利要求1所述的计算机实现的方法,其中,利用所述NLP算法处理所述词嵌入模型包括:
对于所述词嵌入模型的多个子集中的每个子集,将负采样算法应用于所述词嵌入模型的子集,以便确定所述用户出现的加权值。
6.根据权利要求5所述的计算机实施的方法,其中,利用所述NLP算法处理所述词嵌入模型进一步包括:
基于所确定的权重值确定每个用户出现的向量。
7.根据权利要求1所述的计算机实现的方法,其中,应用词嵌入进一步包括:
用连续词袋训练词嵌入模型,其中所述连续词袋包括多个IMSI。
8.一种计算机程序产品,包括:
机器可读存储设备;以及
存储在所述机器可读存储设备上的计算机代码,所述计算机代码包括指令和数据,所述指令和数据用于使得处理器(多个)组执行以下操作,所述操作包括:
从移动网络的一个或多个移动网络提供商获取交易数据记录,
基于获得的交易数据记录识别多个用户出现,其中每个用户出现表示相关联的用户在所述移动网络内的时间和位置的出现,
将词嵌入应用于所述多个用户出现,以生成将所述多个用户出现映射到词汇表的词语的词嵌入模型,以及
用自然语言处理(NLP)算法处理所述词嵌入模型以识别所述移动网络的不同用户之间的关系。
9.根据权利要求8所述的计算机程序产品,进一步包括:
识别用户出现相对于时间或位置的同现;以及
基于识别的用户出现的同现,训练所述词嵌入和NLP算法中的至少一个。
10.一种系统,包括:
接口组件,所述接口组件被配置为用于从移动网络的一个或多个移动网络提供商获得交易数据记录;
数据分析组件,所述数据分析组件被配置为基于获得的交易数据记录来识别多个用户出现,其中每个用户出现表示相关联的用户在所述移动网络内的时间和位置的出现;
词嵌入组件,所述词嵌入组件被配置为将词嵌入应用于所述多个用户出现,以生成将所述多个用户出现映射到词汇表的词语的词嵌入模型;以及
处理单元,所述处理单元被配置为利用自然语言处理NLP算法来处理所述词嵌入模型以识别所述移动网络的不同用户之间的关系。
11.根据权利要求10所述的系统,其中,所述数据分析组件包括:
识别组件,所述识别组件被配置为识别相对于时间或位置的用户出现的同现;以及
训练组件,所述训练组件被配置为基于识别的用户出现的同现来训练所述词嵌入和NLP算法中的至少一个。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于国际商业机器公司,未经国际商业机器公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202080085138.X/1.html,转载请声明来源钻瓜专利网。





