[发明专利]信息排序模型的建模方法、排序方法及建模装置、排序装置有效
申请号: | 201510004674.3 | 申请日: | 2015-01-05 |
公开(公告)号: | CN104462611B | 公开(公告)日: | 2018-06-08 |
发明(设计)人: | 闵金明 | 申请(专利权)人: | 五八同城信息技术有限公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 工业和信息化部电子专利中心 11010 | 代理人: | 梁军 |
地址: | 300457 天津市滨海新区第一*** | 国省代码: | 天津;12 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 信息样本 样本特征 建模 样本 建模装置 排序模型 排序装置 信息排序 相关度 信息检索技术 采集信息 分类信息 样本标注 用户体验 准确率 排序 分类 | ||
本发明公开一种信息排序模型的建模方法、分类方法及建模装置、排序装置,涉及计算和信息检索技术领域,用以解决现有技术中用户获取分类信息准确率较低,速度较慢,用户体验低的问题。所述建模方法包括:采集信息样本;对所述信息样本进行样本标注,以确定所述信息样本的样本相关度;提取所述信息样本的样本特征,并对提取的所述样本特征进行评分以获取所述信息样本的样本特征分数;利用所述样本相关度和所述样本特征分数进行排序模型训练,以建立所述排序模型。
技术领域
本发明涉及计算和信息检索技术领域,特别是涉及一种信息排序模型的建模方法、排序方法及建模装置、排序装置。
背景技术
分类信息是一个全新的产品形态,对于用户从海量分类信息中找到最合适信息的有效方法是搜索技术,其中搜索排序是直接影响用户体验的核心技术之一。传统的分类信息排序一般仅按照信息的新旧程度进行排序。
这种方法在多家信息网站上得到普遍应用,因为信息存在时效性和可交易性的问题,所以一般认为最新的信息在时效性和可交易性上表现比较好。但是在实际系统中,时间最近的信息并不代表这一定就是用户最需要的信息,因为信息包含的维度远不止时间一项。用户同时也会关注这个信息是不是对自己有用,而且也会对信息的虚假程度进行判断,所以按时间排序并不能解决多维度的综合评判的问题。
此外,在多种搜索系统中也有使用文本相关性进行排序的。但是在信息中,因为搜索的对象有商品属性,有很多重要信息是文本之外的,例如价格,上传时间等。仅仅通过搜索的文本相关无法获得最合适的信息。针对用户获取信息准确率较低,速度较慢,用户体验低的问题,现有技术尚无有效解决办法。如何在最短的时间内将用户最需要的信息呈现给用户是本领域亟待解决的问题。
发明内容
本发明要解决的技术问题是提供一种信息排序模型的建模方法、信息分类方法及建模装置、排序装置,用以解决现有技术中用户获取信息准确率较低,速度较慢,用户体验低的问题。
一方面,本发明提供一种信息排序模型的建模方法,包括:采集信息样本;对所述信息样本进行样本标注,以确定所述信息样本的样本相关度;提取所述信息样本的样本特征,并对提取的所述样本特征进行评分以获取所述信息样本的样本特征分数;利用所述样本相关度和所述样本特征分数进行排序模型训练,以建立所述排序模型。
可选的,所述采集信息样本具体包括:在根据搜索请求得到的搜索结果列表中,如果存在至少一个搜索结果令用户进行进一步操作,采集整个列表中的所有搜索结果为信息样本。
可选的,所述对所述信息样本进行样本标注,以获取所述信息样本的样本相关度包括:将用户点击或下载的信息样本的样本相关度标注为最高级;根据所述信息样本的时效性、可交易性或真实性、或者根据实际需要,对被标注为最高级的所述样本相关度进行修正以获取所述信息样本的样本相关度。
可选的,所述提取所述信息样本的样本特征,并对提取的所述样本特征进行评分以获取所述信息样本的样本特征分数具体包括:在所述信息样本中提取预设维度上的样本特征;分别统计所述信息样本在所述预设维度上的样本特征的概率分布;根据所述概率分布,得到所述信息样本在所述预设维度上的样本特征分数。
可选的,所述利用所述样本相关度和所述样本特征分数进行排序模型训练包括:利用所述样本相关度对所述样本特征分数进行加权;使用加权后的所述样本特征分数进行排序模型训练。
另一方面,本发明还提供一种信息排序方法,包括:获取信息在预设维度上的特征分数;将所述特征分数输入根据前述的建模方法所建立的信息排序模型,以获取所述信息的排序分数;根据所述排序分数,对所述信息排序。
可选的,所述获取信息在预设维度上的特征分数进一步包括:查询数据库获取所述特征分数,所述特征存储于所述数据库中;和/或实时对所述信息的特征评分,获取所述特征分数。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于五八同城信息技术有限公司,未经五八同城信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201510004674.3/2.html,转载请声明来源钻瓜专利网。