[发明专利]基于人工智能的匹配度评估方法、装置、设备及存储介质有效
申请号: | 201710348231.5 | 申请日: | 2017-05-17 |
公开(公告)号: | CN107220317B | 公开(公告)日: | 2020-12-18 |
发明(设计)人: | 万圣贤;孙宇;于佃海 | 申请(专利权)人: | 北京百度网讯科技有限公司 |
主分类号: | G06F16/33 | 分类号: | G06F16/33 |
代理公司: | 北京鸿德海业知识产权代理事务所(普通合伙) 11412 | 代理人: | 袁媛 |
地址: | 100085 北京市*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 人工智能 匹配 评估 方法 装置 设备 存储 介质 | ||
本发明公开了基于人工智能的匹配度评估方法、装置、设备及存储介质,其中方法包括:分别获取query中的各单词的单词表达以及title中的各单词的单词表达;根据单词表达,分别获取query中的各单词的基于上下文的单词表达以及title中的各单词的基于上下文的单词表达;根据获取到的信息生成匹配特征;根据匹配特征确定出query与title之间的匹配度评分。应用本发明所述方案,能够提高评估结果的准确性等。
【技术领域】
本发明涉及计算机应用技术,特别涉及基于人工智能的匹配度评估方法、装置、设备及存储介质。
【背景技术】
人工智能(Artificial Intelligence),英文缩写为AI。它是研究、开发用于模拟、延伸和扩展人的智能的理论、方法、技术及应用系统的一门新的技术科学。人工智能是计算机科学的一个分支,它企图了解智能的实质,并生产出一种新的能以人类智能相似的方式做出反应的智能机器,该领域的研究包括机器人、语言识别、图像识别、自然语言处理和专家系统等。
信息检索的一个核心任务就是计算用户输入的查询(query)与作为检索对象的各文档(doc)之间的语义相关程度。
具体地,可对query与各doc的标题(title)的匹配度进行评估,如计算query与title之间的匹配度评分(score),并可按照评分由高到低的顺序对各doc进行排序,进而将排序后处于前N位的doc作为检索结果返回给用户,N为正整数。
现有技术中,在计算query与title之间的匹配度评分时,通常采用以下方式:先用卷积神经网络(CNN,Convolutional Neural Network)或循环神经网络(RNN,RecurrentNeural Network)等分别得到query和title的表达,然后基于这两个表达来计算诸如cosine相似度,从而得到query与title之间的匹配度评分。
但是,上述方式中,将一段复杂的文本作为一个整体映射到一个低维空间中的向量(表达),在压缩过程中容易丢失一些关键的信息,从而只能从整体上对两个文本的匹配程度进行大致评估,评估结果的准确性较低。
【发明内容】
有鉴于此,本发明提供了基于人工智能的匹配度评估方法、装置、设备及存储介质,能够提高评估结果的准确性。
具体技术方案如下:
一种基于人工智能的匹配度评估方法,包括:
分别获取查询query中的各单词的单词表达以及标题title中的各单词的单词表达;
根据所述单词表达,分别获取所述query中的各单词的基于上下文的单词表达以及所述title中的各单词的基于上下文的单词表达;
根据获取到的信息生成匹配特征;
根据所述匹配特征确定出所述query与所述title之间的匹配度评分。
根据本发明一优选实施例,所述分别获取query中的各单词的单词表达以及title中的各单词的单词表达包括:
将所述query中的各单词分别embedding成一个低维向量,得到序列Qe=[q1,…,qi,…,qm];
其中,m表示所述query中包括的单词数,qi表示所述query中的第i个单词的低维向量,i为正整数,且1≤i≤m;
将所述title中的各单词分别embedding成一个低维向量,得到序列Te=[t1,…,tj,…,tn];
其中,n表示所述title中包括的单词数,tj表示所述title中的第j个单词的低维向量,j为正整数,且1≤j≤n。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京百度网讯科技有限公司,未经北京百度网讯科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710348231.5/2.html,转载请声明来源钻瓜专利网。