[发明专利]基于人工智能的匹配度评估方法、装置、设备及存储介质有效

申请号：	201710348231.5	申请日：	2017-05-17
公开（公告）号：	CN107220317B	公开（公告）日：	2020-12-18
发明（设计）人：	万圣贤;孙宇;于佃海	申请（专利权）人：	北京百度网讯科技有限公司
主分类号：	G06F16/33	分类号：	G06F16/33
代理公司：	北京鸿德海业知识产权代理事务所(普通合伙) 11412	代理人：	袁媛
地址：	100085 北京市***	国省代码：	北京;11
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	基于人工智能匹配评估方法装置设备存储介质
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【说明书】：

本发明公开了基于人工智能的匹配度评估方法、装置、设备及存储介质，其中方法包括：分别获取query中的各单词的单词表达以及title中的各单词的单词表达；根据单词表达，分别获取query中的各单词的基于上下文的单词表达以及title中的各单词的基于上下文的单词表达；根据获取到的信息生成匹配特征；根据匹配特征确定出query与title之间的匹配度评分。应用本发明所述方案，能够提高评估结果的准确性等。

【技术领域】

本发明涉及计算机应用技术，特别涉及基于人工智能的匹配度评估方法、装置、设备及存储介质。

【背景技术】

人工智能(Artificial Intelligence)，英文缩写为AI。它是研究、开发用于模拟、延伸和扩展人的智能的理论、方法、技术及应用系统的一门新的技术科学。人工智能是计算机科学的一个分支，它企图了解智能的实质，并生产出一种新的能以人类智能相似的方式做出反应的智能机器，该领域的研究包括机器人、语言识别、图像识别、自然语言处理和专家系统等。

信息检索的一个核心任务就是计算用户输入的查询(query)与作为检索对象的各文档(doc)之间的语义相关程度。

具体地，可对query与各doc的标题(title)的匹配度进行评估，如计算query与title之间的匹配度评分(score)，并可按照评分由高到低的顺序对各doc进行排序，进而将排序后处于前N位的doc作为检索结果返回给用户，N为正整数。

现有技术中，在计算query与title之间的匹配度评分时，通常采用以下方式：先用卷积神经网络(CNN，Convolutional Neural Network)或循环神经网络(RNN，RecurrentNeural Network)等分别得到query和title的表达，然后基于这两个表达来计算诸如cosine相似度，从而得到query与title之间的匹配度评分。

但是，上述方式中，将一段复杂的文本作为一个整体映射到一个低维空间中的向量(表达)，在压缩过程中容易丢失一些关键的信息，从而只能从整体上对两个文本的匹配程度进行大致评估，评估结果的准确性较低。

【发明内容】

有鉴于此，本发明提供了基于人工智能的匹配度评估方法、装置、设备及存储介质，能够提高评估结果的准确性。

具体技术方案如下：

一种基于人工智能的匹配度评估方法，包括：

分别获取查询query中的各单词的单词表达以及标题title中的各单词的单词表达；

根据所述单词表达，分别获取所述query中的各单词的基于上下文的单词表达以及所述title中的各单词的基于上下文的单词表达；

根据获取到的信息生成匹配特征；

根据所述匹配特征确定出所述query与所述title之间的匹配度评分。

根据本发明一优选实施例，所述分别获取query中的各单词的单词表达以及title中的各单词的单词表达包括：

将所述query中的各单词分别embedding成一个低维向量，得到序列Qe＝[q1,…,qi,…,qm]；

其中，m表示所述query中包括的单词数，qi表示所述query中的第i个单词的低维向量，i为正整数，且1≤i≤m；