[发明专利]一种语义检索方法和装置在审
申请号: | 201710291390.6 | 申请日: | 2017-04-28 |
公开(公告)号: | CN108804409A | 公开(公告)日: | 2018-11-13 |
发明(设计)人: | 郑斌;申薇;靳宜 | 申请(专利权)人: | 西安科技大市场创新云服务股份有限公司 |
主分类号: | G06F17/27 | 分类号: | G06F17/27;G06F17/30 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 710075 陕西省西安市*** | 国省代码: | 陕西;61 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 语义向量 搜索关键词 方法和装置 结构化数据 匹配关键词 搜索请求 语义检索 相似度 检索结果 预设条件 检索 数据库 反馈 | ||
本发明实施例提供一种语义检索方法和装置,接收搜索请求以获取所述搜索请求中的搜索关键词;根据所述搜索关键词建立对应语义向量;计算所述对应语义向量与数据库中的需求匹配关键词的语义向量的相似度;获取相似度满足预设条件的所述需求匹配关键词的语义向量对应的结构化数据资源;根据所述搜索关键词在所述结构化数据资源中进行检索并反馈检索结果。
技术领域
本发明涉及计算机技术领域,特别涉及一种语义检索方法和装置。
背景技术
搜索引擎(Search Engine)是指根据一定的策略、运用特定的计算机程序从互联网上或者数据库中搜集信息,在对信息进行组织和处理后,为用户提供检索服务,将用户检索相关的信息展示给用户的系统。搜索引擎包括全文索引、目录索引、元搜索引擎、垂直搜索引擎、集合式搜索引擎、门户搜索引擎与免费链接列表等。
用户在利用搜索引擎获取信息时,在很多情况下需求是比较明确的,搜索引擎应该针对用户输入的搜索词到需求对应的数据资源中搜索与该搜索词匹配的信息并返回给用户。其中,在确定需求对应的数据资源时,将搜索词与数据资源对应的需求匹配关键词进行匹配,但数据资源对应的需求匹配关键词往往是单一的,这就需要用户搜索词与需求匹配关键词的表述方式一致才能找到对应的数据资源,但用户表达同一需求时使用的用户搜索词是多样化的,这就可能造成搜索时采用的数据资源不准确,进而返回的搜索结果不准确。
上述问题在结构化数据搜索中尤为突出,结构化数据资源通常为内网资源,结构化数据库中结构化数据资源时通常只匹配单一的需求匹配关键词。如果输入的用户搜索词与数据库中的需求匹配关键词不一致,可能就无法准确映射到对应的结构化数据资源上,从而无法获得准确搜索结果,用户只能多次尝试输入搜索词,降低了搜索效率。
发明内容
本发明实施例提供的一种语义检索方法和装置,能够解决现有技术存在的无法获得准确搜索结果,用户只能多次尝试输入搜索词,降低了搜索效率的问题。
为了解决上述问题,本发明实施例提供一种语义检索方法,应用于结构化数据搜索,包括:
接收搜索请求以获取所述搜索请求中的搜索关键词;
根据所述搜索关键词建立对应语义向量;
计算所述对应语义向量与数据库中的需求匹配关键词的语义向量的相似度;
获取相似度满足预设条件的所述需求匹配关键词的语义向量对应的结构化数据资源;
根据所述搜索关键词在所述结构化数据资源中进行检索并反馈检索结果。
可选的,所述方法之前还包括:
预先分别建立数据库中各结构化数据资源对应的需求匹配关键词的语义向量。
可选的,所述建立数据库中各结构化数据资源对应的需求匹配关键词的语义向量,包括:
从所述结构化数据资源的描述信息中提取指定标签对应的内容构成所述结构化数据资源的需求匹配关键词的语义向量;或,
利用所述结构化数据资源对应的需求匹配关键词对应的搜索结果标题构成所述结构化数据资源的需求匹配关键词的语义向量;或,
利用所述结构化数据资源对应的需求匹配关键词的同义词构成所述结构化数据资源的需求匹配关键词的语义向量。
可选的,所述计算所述对应语义向量与数据库中的需求匹配关键词的语义向量的相似度,包括:
在数据中查找预先建立的所述搜索关键词与所述需求匹配关键词的映射关系,其中,所述映射关系是在计算搜索日志中的历史搜索关键词与各需求匹配关键词的语义向量的相似度后,选择相似度满足所述预设条件的需求匹配关键词和所述搜索关键词建立的;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于西安科技大市场创新云服务股份有限公司,未经西安科技大市场创新云服务股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710291390.6/2.html,转载请声明来源钻瓜专利网。