[发明专利]对搜索条目进行排序的方法及系统有效
| 申请号: | 201510047913.3 | 申请日: | 2015-01-29 |
| 公开(公告)号: | CN104598611B | 公开(公告)日: | 2018-03-23 |
| 发明(设计)人: | 张军;徐晓明;吴先超;和为;刘占一;于佃海 | 申请(专利权)人: | 百度在线网络技术(北京)有限公司 |
| 主分类号: | G06F17/30 | 分类号: | G06F17/30;G06N3/02 |
| 代理公司: | 广州三环专利商标代理有限公司44202 | 代理人: | 温旭,郝传鑫 |
| 地址: | 100085 北京市*** | 国省代码: | 北京;11 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 搜索 条目 进行 排序 方法 系统 | ||
技术领域
本发明涉及通信领域,更为具体而言,涉及对搜索条目进行排序的方法及系统。
背景技术
针对用户所输入的查询文本,给用户返回排序的搜索结果是搜索引擎系统的基础。其中计算用户输入的查询文本与待排序的搜索条目之间的排序分数是搜索引擎系统的核心问题。
传统的计算查询文本与搜索条目之间的排序分数的方法是通过计算查询文本与搜索条目这两个字符串中所包含的词完全匹配上的程度,即这两个文本串的相似度,来计算查询文本与搜索条目之间的排序分数。但是这种基于词的字面上的匹配程度来计算排序分数的方法,并没有能考察到词的一词多义以及近似词的匹配,也没有考察到词的顺序问题。近年来,随着深度学习技术的发展,出现了利用DNN(Deep Neural Network,深度神经网络)技术来学习词的向量表示(把词表示为一个实数组成的向量),通过计算由词向量组成的查询文本与搜索条目之间的相似度来计算查询文本与搜索条目之间的排序分数的方法。这种方法一般通过一个FeedForward Neural Network(前馈神经网络)来把查询文本与搜索条目中的词都映射到一个低维的向量空间当中;简单的把查询文本中的所有词的词向量相加得到查询文本的向量表示,把搜索条目中的所有的词的词向量也相加得到搜索条目的向量表示,通过计算这两个向量表示之间的相似度来作为查询文本与搜索条目之间的排序分数。这种方法虽然从一定程度上解决了传统方法当中的一词多义与近义词的问题,但是,因为忽略了词在查询文本与搜索条目当中的位置信息,因此不能解决查询文本与搜索条目中的词的顺序不同所带来的差异,例如:查询文本1:“我爱百度”与查询文本2:“百度爱我”两个查询文本的向量表示是一样的,因此会针对同样的搜素条目,给出同样的排序分数。
发明内容
为有效地解决上述技术问题,本发明提供了一种对搜索条目进行排序的方法及系统。
一方面,本发明的实施方式提供了一种对搜索条目进行排序的方法,所述方法包括:
通过神经网络将查询文本按照语序表示成向量;
根据所述表示出的向量通过所述神经网络计算所述查询文本与搜索条目之间的排序分数;
根据所述计算出的排序分数对所述搜索条目进行排序。
另一方面,本发明的实施方式还提供了一种对搜索条目进行排序的系统,所述系统包括:
表示模块,用于通过神经网络将查询文本按照语序表示成向量;
计算模块,用于根据所述表示模块所表述出的向量通过所述神经网络计算所述查询文本与搜索条目之间的排序分数;
排序模块,用于根据所述计算模块所计算出的排序分数对所述搜索条目进行排序。
实施本发明提供的对搜索条目进行排序的方法及系统可以兼顾一词多义与近义词的匹配以及词的语序来进行搜索排序,能够给出更为准确的排序结果。
附图说明
图1是根据本发明实施方式的一种对搜索条目进行排序的方法的流程图;
图2示出了图1所示的步骤S110的一种实施方式;
图3示出了图1所示的步骤S120的一种实施方式;
图4是根据本发明实施方式的另一种对搜索条目进行排序的方法的框架图;
图5是根据本发明实施方式的神经网络中的编码网络的结构示意图;
图6是根据本发明实施方式的神经网络中的解码网络的结构示意图;
图7是根据本发明实施方式的一种对搜索条目进行排序的系统的结构示意图;
图8示出了图7所示的表示模块110的一种实施方式。
具体实施方式
为使本发明的实施例的目的、技术方案和优点更加清楚,下面将结合附图对本发明作进一步地详细描述。
图1是根据本发明实施方式的一种对搜索条目进行排序的方法的流程图。参见图1,所述方法包括:
S110:通过神经网络将查询文本按照语序表示成向量。
其中,神经网络又称人工神经网络,是一种应用类似于大脑神经突触联接的结构进行信息处理的数学模型,可以用电子线路来实现,也可以用计算机程序来模拟,是人工智能研究的一种方法。
S120:根据所述表示出的向量通过所述神经网络计算所述查询文本与搜索条目之间的排序分数。
S130:根据所述计算出的排序分数对所述搜索条目进行排序。
在上述实施方式中,通过将查询文本按照语序表示成向量可以实现兼顾一词多义与近义词的匹配以及词的语序来进行搜索排序,能够给出更为准确的排序结果。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于百度在线网络技术(北京)有限公司,未经百度在线网络技术(北京)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201510047913.3/2.html,转载请声明来源钻瓜专利网。





