[发明专利]应用标签生成方法、装置及存储设备有效

专利信息
申请号: 201810059509.1 申请日: 2018-01-22
公开(公告)号: CN110069769B 公开(公告)日: 2023-05-02
发明(设计)人: 傅波;何泉昊;陈建荣 申请(专利权)人: 腾讯科技(深圳)有限公司
主分类号: G06F40/284 分类号: G06F40/284;G06F40/30;G06N3/0455;G06N3/044;G06N3/048
代理公司: 深圳翼盛智成知识产权事务所(普通合伙) 44300 代理人: 黄威
地址: 518057 广东省深圳*** 国省代码: 广东;44
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 应用 标签 生成 方法 装置 存储 设备
【权利要求书】:

1.一种应用标签生成方法,其特征在于,包括:

获取应用的详情信息;所述应用的详情信息包括应用的标题、应用的评论信息、应用的描述文本、应用的推荐语和应用的最近更新特性信息;

从所述应用的详情信息中提取原始关键词;

利用语义解析模型对所述原始关键词进行语义解析,生成目标关键词;所述目标关键词包括所对应原始关键词的规范描述词和语义挖掘词中的至少一项;

根据所述目标关键词确定所述应用的标签;

其中,所述根据所述目标关键词确定所述应用的标签,包括:

获取所述语义解析模型所生成各所述目标关键词的生成概率;

将目标关键词对应的原始关键词的来源对应的权重,作为所述目标关键词的权重,所述来源包括标题、评论信息、描述文本、推荐语和最近更新特性信息;

根据每个目标关键词的权重和每个目标关键词的生成概率,计算各目标关键词的标签得分;

根据目标关键词的标签得分进行目标关键词筛选,得到所述应用的标签。

2.根据权利要求1所述的方法,其特征在于,在获取应用的详情信息之前,所述方法还包括:

将样本关键词作为序列到序列模型的源输入,将样本关键词的规范描述词和/或语义挖掘词作为所述序列到序列模型的目标输出,进行模型训练,得到所述语义解析模型。

3.根据权利要求2所述的方法,其特征在于,所述利用语义解析模型对所述原始关键词进行语义解析,生成目标关键词,包括:

在编码阶段,将所述原始关键词编码成一个语义向量;

在解码阶段,每一步根据所述语义向量和已经生成的解码输出数据进行解码输出,得到所述目标关键词。

4.根据权利要求2所述的方法,其特征在于,所述利用语义解析模型对所述原始关键词进行语义解析,生成目标关键词,包括:

在编码阶段,将所述原始关键词编码成语义向量序列,所述语义向量序列中包括每个原始关键词对应的语义向量;

在解码阶段,每一步根据当前解码的原始关键词对应的语义向量和已经生成的解码输出数据进行解码输出,得到所述目标关键词。

5.根据权利要求1所述的方法,其特征在于,所述从所述应用的详情信息中提取原始关键词,包括:

对所述应用的详情信息进行分词、过滤和筛选处理,得到至少一个关键词;

计算所述至少一个关键词的词频-逆向文档频率TF-IDF值,提取TF-IDF值大于预设阈值的关键词作为所述原始关键词。

6.一种应用标签生成装置,其特征在于,包括:

获取单元,用于获取应用的详情信息;所述应用的详情信息包括应用的标题、应用的评论信息、应用的描述文本、应用的推荐语和应用的最近更新特性信息;

提取单元,用于从所述应用的详情信息中提取原始关键词;

生成单元,用于利用语义解析模型对所述原始关键词进行语义解析,生成目标关键词;所述目标关键词包括所对应原始关键词的规范描述词和语义挖掘词中的至少一项;

确定单元,用于根据所述目标关键词确定所述应用的标签;

所述确定单元进一步用于:

获取所述语义解析模型所生成各所述目标关键词的生成概率;

将目标关键词对应的原始关键词的来源对应的权重,作为所述目标关键词的权重,所述来源包括标题、评论信息、描述文本、推荐语和最近更新特性信息;

根据每个目标关键词的权重和每个目标关键词的生成概率,计算各目标关键词的标签得分;

根据目标关键词的标签得分进行目标关键词筛选,得到所述应用的标签。

7.根据权利要求6所述的装置,其特征在于,所述装置还包括:

训练单元,用于将样本关键词作为序列到序列模型的源输入,将样本关键词的规范描述词和/或语义挖掘词作为所述序列到序列模型的目标输出,进行模型训练,得到所述语义解析模型。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于腾讯科技(深圳)有限公司,未经腾讯科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201810059509.1/1.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top