[发明专利]基于用户搜索记录的性别年龄判别方法及装置在审
申请号: | 201910354376.5 | 申请日: | 2019-04-29 |
公开(公告)号: | CN110083785A | 公开(公告)日: | 2019-08-02 |
发明(设计)人: | 黄永峰;武楚涵;吴思行 | 申请(专利权)人: | 清华大学 |
主分类号: | G06F16/955 | 分类号: | G06F16/955;G06F16/35;G06F16/36;G06N3/04 |
代理公司: | 北京清亦华知识产权代理事务所(普通合伙) 11201 | 代理人: | 张润 |
地址: | 10008*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开了一种基于用户搜索记录的性别年龄判别方法及装置,其中,方法包括:对搜索记录中的词语进行建模,搜索得到每个词语的语义表示向量;对搜索记录进行建模,通过词语级的卷积神经网络捕获词语间上下文依赖关系,并选取满足第一预设条件的词语,以构建搜索记录的上下文表示向量;基于搜索记录对用户建模,通过记录级的卷积神经网络捕获搜索记录间的上下文依赖关系,并选取满足第二预设条件的搜索记录,以构建搜索用户的表示向量;基于用户表示向量的用户分类,通过全连接层对用户向量进行解码,并使用softmax函数对分类概率归一化。该方法有效地提升了用户性别年龄预测的性能,同时有广大的用户覆盖量。 | ||
搜索关键词: | 搜索 记录 向量 词语 上下文依赖关系 卷积神经网络 用户搜索 预设条件 构建 建模 捕获 上下文表示 分类概率 用户表示 用户分类 用户覆盖 用户建模 用户性别 语义表示 解码 归一化 连接层 有效地 预测 | ||
【主权项】:
1.一种基于用户搜索记录的性别年龄判别方法,其特征在于,包括以下步骤:步骤S1:对搜索记录中的词语进行建模,并利用预训练的词向量得到每条搜索记录中每个词语的语义表示向量;步骤S2,对所述搜索记录进行建模,通过词语级的卷积神经网络捕获词语间上下文依赖关系,并使用注意力机制选取满足第一预设条件的词语,以构建搜索记录的上下文表示向量;步骤S3,基于所述搜索记录对用户建模,通过记录级的卷积神经网络捕获搜索记录间的上下文依赖关系,并使用注意力机制选取满足第二预设条件的搜索记录,以构建搜索用户的表示向量;以及步骤S4,基于用户表示向量的用户分类,通过全连接层对用户向量进行解码,并使用softmax函数对分类概率归一化。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于清华大学,未经清华大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201910354376.5/,转载请声明来源钻瓜专利网。
- 上一篇:数据处理方法以及装置、服务器
- 下一篇:一种链接验证方法及装置