[发明专利]一种主题词生成模型的训练方法及计算设备在审
申请号: | 202110710401.6 | 申请日: | 2021-06-25 |
公开(公告)号: | CN113609841A | 公开(公告)日: | 2021-11-05 |
发明(设计)人: | 李辉;陈永生 | 申请(专利权)人: | 北京齐尔布莱特科技有限公司 |
主分类号: | G06F40/216 | 分类号: | G06F40/216;G06F40/289;G06F40/30;G06N20/10 |
代理公司: | 北京思睿峰知识产权代理有限公司 11396 | 代理人: | 高攀;赵爱军 |
地址: | 100080 北京市海*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开了一种主题词生成模型的训练方法,在计算设备中执行,包括步骤:获取文档集合和记录用户行为的日志;针对用户每一次搜索行为,对用户搜索的关键词进行分词处理,得到一个或多个切分后的词;针对每一个切分后的词和文档集合中的每一个文档,根据切分后的词、日志和文档集合生成特征向量,将切分后的词作为特征向量的标签,并确定包含特征向量及其标签的样本为正样本或负样本;根据样本,对主题词生成模型进行训练,得到训练后的主题词生成模型。本发明一并公开了相应的装置、计算设备及可读存储介质。 | ||
搜索关键词: | 一种 主题词 生成 模型 训练 方法 计算 设备 | ||
【主权项】:
暂无信息
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京齐尔布莱特科技有限公司,未经北京齐尔布莱特科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/202110710401.6/,转载请声明来源钻瓜专利网。