[发明专利]关系网络生成方法、装置、电子设备及存储介质在审
申请号: | 202011034030.6 | 申请日: | 2020-09-27 |
公开(公告)号: | CN112115233A | 公开(公告)日: | 2020-12-22 |
发明(设计)人: | 戴明洋 | 申请(专利权)人: | 北京百度网讯科技有限公司 |
主分类号: | G06F16/33 | 分类号: | G06F16/33;G06F16/36;G06F16/951 |
代理公司: | 北京市铸成律师事务所 11313 | 代理人: | 杨瑾瑾;林军 |
地址: | 100085 北京市*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 关系 网络 生成 方法 装置 电子设备 存储 介质 | ||
1.一种关系网络生成方法,包括:
获取预设时长内N个用户分别对应的至少一个历史文本数据;其中,N为大于等于1的整数;
对所述N个用户分别对应的至少一个历史文本数据进行采样,得到所述N个用户分别对应的采样后的文本数据;
基于所述N个用户分别对应的采样后的文本数据确定所述N个用户分别对应的语义向量,基于所述N个用户分别对应的语义向量生成包含N个用户的语义化关系网络。
2.根据权利要求1所述的方法,其中,所述历史文本数据包括:搜索词信息以及浏览题目信息;
相应的,所述方法还包括:
获取所述N个用户中第i个用户在所述预设时长内的至少一个搜索词信息以及至少一个浏览题目信息;其中,i为大于等于1且小于等于N的整数;
基于所述第i个用户在所述预设时长内的至少一个搜索词信息以及至少一个浏览题目信息,生成所述第i个用户对应的搜索词信息集合以及浏览题目集合。
3.根据权利要求2所述的方法,其中,所述对所述N个用户分别对应的至少一个历史文本数据进行采样,得到所述N个用户分别对应的采样后的文本数据,包括:
对所述N个用户中的所述第i个用户对应的所述搜索词信息集合进行采样得到采样后的至少一个搜索词采样数据,以及对所述第i个用户对应的所述浏览题目集合进行采样得到采样后的至少一个浏览题目采样数据;
将所述第i个用户的至少一个搜索词采样数据以及至少一个浏览题目采样数据作为所述第i个用户的采样后的文本数据。
4.根据权利要求3所述的方法,其中,所述对所述N个用户中的所述第i个用户对应的搜索词信息集合进行采样得到采样后的至少一个搜索词采样数据,包括:
基于所述N个用户中的所述第i个用户的所述搜索词信息集合中的搜索词信息的出现次数以及随机数进行计算,得到所述搜索词信息所对应的频率采样分值;选取所述频率采样分值最大的前K个的搜索词信息作为至少一个搜索词采样数据;其中,K为大于等于1的整数;
和/或,
获取所述N个用户中的所述第i个用户的所述搜索词信息集合中的搜索词信息的时间戳以及当前时刻的时间差,基于所述时间差以及随机数进行计算,得到搜索词信息所对应的时间采样分值;选取时间采样分值最小的前L个的搜索词信息作为至少一个搜索词采样数据;其中,L为大于等于1的整数。
5.根据权利要求3所述的方法,其中,所述对所述第i个用户对应的所述浏览题目集合进行采样得到采样后的至少一个浏览题目采样数据,包括:
基于所述N个用户中的所述第i个用户的所述浏览题目集合中的浏览题目信息的出现次数以及随机数进行计算,得到所述浏览题目信息所对应的频率采样分值;选取所述频率采样分值最大的前H个的浏览题目信息作为至少一个浏览题目采样数据;其中,H为大于等于1的整数;
和/或,
获取所述N个用户中的所述第i个用户的所述浏览题目集合中的浏览题目信息的时间戳以及当前时刻的时间差,基于所述时间差以及随机数进行计算,得到浏览题目信息所对应的时间采样分值;选取时间采样分值最小的前G个的浏览题目信息作为至少一个浏览题目采样数据;其中,G为大于等于1的整数。
6.根据权利要求1所述的方法,其中,所述基于所述N个用户分别对应的采样后的文本数据确定所述N个用户分别对应的语义向量,包括:
基于所述N个用户中第i个用户的采样后的文本数据生成对应的句向量;
基于所述句向量生成所述第i个用户的语义向量。
7.一种关系网络生成装置,包括:
获取模块,用于获取预设时长内N个用户分别对应的至少一个历史文本数据;其中,N为大于等于1的整数;
采样模块,用于对所述N个用户分别对应的至少一个历史文本数据进行采样,得到所述N个用户分别对应的采样后的文本数据;
网络生成模块,用于基于所述N个用户分别对应的采样后的文本数据确定所述N个用户分别对应的语义向量,基于所述N个用户分别对应的语义向量生成包含N个用户的语义化关系网络。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京百度网讯科技有限公司,未经北京百度网讯科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011034030.6/1.html,转载请声明来源钻瓜专利网。