[发明专利]一种数据处理方法、装置、电子设备以及存储介质有效
| 申请号: | 201711252207.8 | 申请日: | 2017-12-01 |
| 公开(公告)号: | CN110020151B | 公开(公告)日: | 2022-04-26 |
| 发明(设计)人: | 贺宇;董国盛;周泽南;苏雪峰;佟子健 | 申请(专利权)人: | 北京搜狗科技发展有限公司 |
| 主分类号: | G06F16/9535 | 分类号: | G06F16/9535;G06F16/958 |
| 代理公司: | 北京润泽恒知识产权代理有限公司 11319 | 代理人: | 莎日娜 |
| 地址: | 100084 北京市海淀区中关*** | 国省代码: | 北京;11 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 数据处理 方法 装置 电子设备 以及 存储 介质 | ||
本发明实施例提供了一种数据处理方法、装置、电子设备以及存储介质,以提高相关性确定的准确性。所述的方法包括:依据目标搜索结果中关键词和站点信息,构成关键词和站点信息的关联路径;依据所述关联路径和预设模型,确定关键词的第一词向量和站点信息的第二词向量;依据所述第一词向量和第二词向量,计算所述关键词和站点信息的相关性。无需人工的分类处理,有效提高相关度确定的准确性。
技术领域
本发明涉及计算机技术领域,特别是涉及一种数据处理方法、一种数据处理装置、一种电子设备,以及一种存储介质。
背景技术
随着网络技术的发展,越来越多的用户通过网络查询所需的各种信息,例如查询热播的影视作品、热门游戏,以及各种商品的性能、排行等,从而能够基于查询的结果辅助进行信息的选择。
通常在查询时需要对查询结果进行排序后反馈,一些方式是对站点的质量进行打分,但是这种方式没有考虑查询词和站点之间的相关性,排序结果可能不符合用户的要求,而造成查询效率的降低。而一些确定关键词和站点间相关性的方式通常是按照类别确定相关性,即通过类别的匹配程度来计算查询词和站点的相关性,但是这种方式的类别和分类特征通常是人工设置的,分类的准确性也不能得到保证,因此相关性计算的准确性难以保证,依据该相关性执行的排序准确性也较低。
发明内容
本发明实施例所要解决的技术问题是提供一种数据处理方法,以提高相关性确定的准确性。
相应的,本发明实施例还提供了一种数据处理装置、一种电子设备及一种存储介质,用以保证上述方法的实现及应用。
为了解决上述问题,本发明实施例公开了一种数据处理方法,所述的方法包括:依据目标搜索结果中关键词和站点信息,构成关键词和站点信息的关联路径;依据所述关联路径和预设模型,确定关键词的第一词向量和站点信息的第二词向量;依据所述第一词向量和第二词向量,计算所述关键词和站点信息的相关性。
可选的,所述依据目标搜索结果中关键词和站点信息,构成关键词和站点信息的关联路径,包括:确定多个目标搜索结果,并从各目标搜索结果中分别提取关键词和所述关键词对应的站点信息;采用所述关键词和站点信息的对应关系构成关联路径。
可选的,所述采用所述关键词和站点信息的对应关系构成关联路径,包括:依据所述关键词和站点信息的对应关系,将各关键词和相应的站点信息连接,构成所述关键词和站点信息的二部图;依据二部图确定多个所述关键词和站点信息的关联路径。
可选的,所述依据二部图确定多个所述关键词和站点信息的关联路径,包括:依据所述二部图,通过随机游走方式将关键词和站点信息串联,生成多个关联路径。
可选的,所述依据关联路径和预设模型,确定关键词的第一词向量和站点信息的第二词向量,包括:依据所述关联路径生成向量信息,其中,所述向量信息包括关键词的第一路径向量和站点信息的第二路径向量;将所述向量信息输入到预设模型中,得到关键词的第一词向量和站点信息的第二词向量。
可选的,所述依据第一词向量和第二词向量,计算所述关键词和站点信息的相关性,包括:选择关键词和站点信息;将关键词的第一词向量和站点信息的第二词向量进行相关性计算,得到所述关键词和站点信息之间的相关性。
可选的,还包括:在通过查询词执行设定业务时,从查询结果中获取查询词对应的网址信息,其中,所述设定业务包括以下至少一种:搜索业务、推荐业务;将所述查询词作为关键词,将所述网址信息作为站点信息,查询对应关键词和站点信息的相关性。
本发明实施例还提供了一种数据处理装置,包括:路径确定模块,用于依据目标搜索结果中关键词和站点信息,构成关键词和站点信息的关联路径;词向量确定模块,用于依据所述关联路径和预设模型,确定关键词的第一词向量和站点信息的第二词向量;相关性计算模块,用于依据所述第一词向量和第二词向量,计算所述关键词和站点信息的相关性。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京搜狗科技发展有限公司,未经北京搜狗科技发展有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201711252207.8/2.html,转载请声明来源钻瓜专利网。





