[发明专利]基于用户搜索记录的性别年龄判别方法及装置在审

专利信息
申请号: 201910354376.5 申请日: 2019-04-29
公开(公告)号: CN110083785A 公开(公告)日: 2019-08-02
发明(设计)人: 黄永峰;武楚涵;吴思行 申请(专利权)人: 清华大学
主分类号: G06F16/955 分类号: G06F16/955;G06F16/35;G06F16/36;G06N3/04
代理公司: 北京清亦华知识产权代理事务所(普通合伙) 11201 代理人: 张润
地址: 10008*** 国省代码: 北京;11
权利要求书: 查看更多 说明书: 查看更多
摘要: 发明公开了一种基于用户搜索记录的性别年龄判别方法及装置,其中,方法包括:对搜索记录中的词语进行建模,搜索得到每个词语的语义表示向量;对搜索记录进行建模,通过词语级的卷积神经网络捕获词语间上下文依赖关系,并选取满足第一预设条件的词语,以构建搜索记录的上下文表示向量;基于搜索记录对用户建模,通过记录级的卷积神经网络捕获搜索记录间的上下文依赖关系,并选取满足第二预设条件的搜索记录,以构建搜索用户的表示向量;基于用户表示向量的用户分类,通过全连接层对用户向量进行解码,并使用softmax函数对分类概率归一化。该方法有效地提升了用户性别年龄预测的性能,同时有广大的用户覆盖量。
搜索关键词: 搜索 记录 向量 词语 上下文依赖关系 卷积神经网络 用户搜索 预设条件 构建 建模 捕获 上下文表示 分类概率 用户表示 用户分类 用户覆盖 用户建模 用户性别 语义表示 解码 归一化 连接层 有效地 预测
【主权项】:
1.一种基于用户搜索记录的性别年龄判别方法,其特征在于,包括以下步骤:步骤S1:对搜索记录中的词语进行建模,并利用预训练的词向量得到每条搜索记录中每个词语的语义表示向量;步骤S2,对所述搜索记录进行建模,通过词语级的卷积神经网络捕获词语间上下文依赖关系,并使用注意力机制选取满足第一预设条件的词语,以构建搜索记录的上下文表示向量;步骤S3,基于所述搜索记录对用户建模,通过记录级的卷积神经网络捕获搜索记录间的上下文依赖关系,并使用注意力机制选取满足第二预设条件的搜索记录,以构建搜索用户的表示向量;以及步骤S4,基于用户表示向量的用户分类,通过全连接层对用户向量进行解码,并使用softmax函数对分类概率归一化。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于清华大学,未经清华大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/patent/201910354376.5/,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top