[发明专利]为文章匹配对象的方法、系统、设备及存储介质在审
申请号: | 201810682104.3 | 申请日: | 2018-06-27 |
公开(公告)号: | CN110717092A | 公开(公告)日: | 2020-01-21 |
发明(设计)人: | 张亮;佘志东;张震涛;王刚;饶正锋;缪世磊 | 申请(专利权)人: | 北京京东尚科信息技术有限公司;北京京东世纪贸易有限公司 |
主分类号: | G06F16/9535 | 分类号: | G06F16/9535;G06F16/9536;G06F16/332;G06K9/62 |
代理公司: | 31283 上海弼兴律师事务所 | 代理人: | 薛琦;邓忠红 |
地址: | 100195 北京市海淀区杏石口路6*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开了一种为文章匹配对象的方法、系统、设备及存储介质,方法包括:获取类目下的所有对象;提取类目下的每个对象的至少一个卖点词;提取待匹配文章中的至少一个关键词;获取每个关键词对应的词向量,记为关键词词向量;获取每个卖点词对应的词向量,记为卖点词词向量;使用关键词词向量与每个对象的卖点词词向量进行相似度计算得到相应的相似度系数;计算每个关键词的TF‑IDF;根据相似度系数及相应的关键词的TF‑IDF计算待匹配文章与每个对象的相似分数;将相似分数最高的若干个对象作为待匹配文章最终的匹配对象。本发明实现了自动为待匹配文章精准匹配一组对象,能够显著降低人工为待匹配文章挑选对象所耗费的时间,提高自动文案生成的效率。 | ||
搜索关键词: | 匹配 词向量 匹配对象 相似度 词词 向量 相似度计算 存储介质 组对象 | ||
【主权项】:
1.一种为文章匹配对象的方法,每篇所述文章均对应有相应的类目,其特征在于,所述方法包括:/n获取所述类目下的所有对象;/n提取所述类目下的每个所述对象的至少一个卖点词;/n提取待匹配文章中的至少一个关键词;/n获取所述待匹配文章中每个所述关键词对应的词向量,记为关键词词向量;/n获取每个所述对象的每个所述卖点词对应的词向量,记为卖点词词向量;/n使用所述关键词词向量与每个所述对象的所述卖点词词向量进行相似度计算得到相应的相似度系数;/n计算每个所述关键词的TF-IDF;/n根据所述相似度系数及相应的所述关键词的TF-IDF计算所述待匹配文章与每个所述对象的相似分数;/n将所述相似分数最高的若干个所述对象作为所述待匹配文章最终的匹配对象。/n
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京京东尚科信息技术有限公司;北京京东世纪贸易有限公司,未经北京京东尚科信息技术有限公司;北京京东世纪贸易有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201810682104.3/,转载请声明来源钻瓜专利网。