[发明专利]模型获取方法、关键词生成方法、装置、介质及计算设备有效
| 申请号: | 201910136539.2 | 申请日: | 2019-02-22 |
| 公开(公告)号: | CN109960749B | 公开(公告)日: | 2021-04-06 |
| 发明(设计)人: | 黄民烈;周昊;朱小燕 | 申请(专利权)人: | 清华大学 |
| 主分类号: | G06F16/901 | 分类号: | G06F16/901;G06F16/951;G06F16/953 |
| 代理公司: | 北京志霖恒远知识产权代理事务所(普通合伙) 11435 | 代理人: | 韩雪梅 |
| 地址: | 100084 北*** | 国省代码: | 北京;11 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | 本发明的实施方式提供了一种模型获取方法、关键词生成方法、装置、介质及计算设备。模型获取方法包括:构建关键词生成模型,该模型包括基于编码器‑注意力机制‑解码器框架的主模块;在监督学习阶段,针对每个训练数据对,主模块基于其中源关键词和参考目标关键词的语义和领域信息构建概率分布,从概率分布中采样第一隐变量,生成第一目标关键词;通过最小化主模块的损失函数,利用梯度反向传播方式来更新主模块的参数。本发明的上述技术能够生成热门高频关键词以外的低频相关关键词,通过引入领域约束使生成的目标关键词与源关键词的领域更相关;此外,还可利用强化学习进一步地提高关键词的相关性和领域一致性。 | ||
| 搜索关键词: | 模型 获取 方法 关键词 生成 装置 介质 计算 设备 | ||
【主权项】:
1.一种基于领域约束的关键词生成模型的模型获取方法,其特征在于包括:构建关键词生成模型,所述关键词生成模型包括基于编码器‑注意力机制‑解码器框架的主模块;获取多个训练数据对,其中,每个训练数据对包括领域相匹配的源关键词和参考目标关键词;以及利用所述多个训练数据对训练所述主模块,其中,所述训练的过程包括监督学习阶段,所述监督学习阶段包括:针对每一个训练数据对,所述主模块基于该训练数据对中源关键词和参考目标关键词的语义信息和领域信息来构建概率分布,从概率分布中采样第一隐变量,并且基于所述第一隐变量生成第一目标关键词;以及通过最小化主模块的损失函数,利用梯度反向传播方式来更新所述主模块的参数。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于清华大学,未经清华大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201910136539.2/,转载请声明来源钻瓜专利网。





