[发明专利]一种数据源的选择方法及系统无效
申请号: | 201010252121.7 | 申请日: | 2010-08-06 |
公开(公告)号: | CN102135974A | 公开(公告)日: | 2011-07-27 |
发明(设计)人: | 贾江涛;胡汉强;顾翀;孟卫一 | 申请(专利权)人: | 华为软件技术有限公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 深圳市深佳知识产权代理事务所(普通合伙) 44285 | 代理人: | 彭愿洁;李文红 |
地址: | 210012 江苏省*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 数据源 选择 方法 系统 | ||
技术领域
本发明涉及信息检索技术领域,尤其涉及一种数据源的选择方法及系统。
背景技术
随着互联网的迅速发展和壮大,网络上可利用的信息资源的数量越来越大,类型也越来越丰富,面对数量庞大且无组织的信息资源,如何更好的帮助用户快速准确的查询到所需要的信息就成为信息检索领域一个非常重要的研究课题。搜索引擎的出现极大地提高了人们定位和收集信息的能力,搜索引擎通过收集众多网络站点的页面来提供全局性网络资源控制与检索机制,以帮助用户方便快捷地找到所需的信息资源。
随着信息资源的急剧膨胀,传统的信息资源无法提供某一关键词对应的更深入更专业的信息。包含结构化数据的数据源的出现缓解了上述问题,它可以针对某一领域或某一主题等提供更专业、更深入更全面的信息数据,例如餐饮信息“湘江老厨,**大街*号,电话***,剁椒鱼头......”等。
然而,发明人在实现本发明的过程中发现,在一个整合的搜索平台接入多个数据源,当搜索平台接收到用户输入的查询信息时,由于接入的数据源众多,而无法判断哪个数据源能向用户提供更匹配的信息资源。
发明内容
本发明实施例提供一种数据源的选择方法及系统,能够为用户选择可以提供更匹配信息资源的数据源。
为了解决上述技术问题,本发明实施例的技术方案如下:
本发明实施例提供一种数据源的选择方法,所述方法包括:
接收查询请求并获取请求中的关键词;
确定所述关键词在所述属性索引项中的对应属性,其中,所述属性索引项为数据源中结构化数据的属性索引项;
计算所述属性在各所述数据源中对应的属性值与所述关键词的综合相似度;
选择综合相似度满足预置条件的属性值对应的数据源作为满足所述查询请求的数据源。
本发明实施例还提供一种数据源的选择系统,其特征在于,包括:
属性创建单元,用于建立数据源中结构化数据的属性索引项;
请求接收单元,用于接收查询请求并获取请求中的关键词;
属性确定单元,用于确定所述关键词在所述属性索引项中的对应属性;
计算单元,用于计算所述属性在各所述数据源中对应的属性值与所述关键词的综合相似度;
选择单元,用于选择综合相似度满足预置条件的属性值对应的数据源作为满足所述查询请求的数据源。
本发明实施例通过创建各数据源中结构化数据的属性索引项,然后根据查询关键词和对应属性获得综合相似度,进而实现了对结构化数据源的准确选择,从而可以为用户提供更加匹配的信息,满足了用户的查询需求。
附图说明
图1是本发明实施例一种数据源的选择方法流程图;
图2是本发明实施例一的方法流程图;
图3是本发明实施例二的方法流程图;
图4是本发明实施例三的方法流程图;
图5是本发明实施例四的方法流程图;
图6是本发明实施例一种数据源的选择系统的结构示意图;
图7是本发明实施例另一种数据源的选择系统的结构示意图;
图8是本发明实施例另一种数据源的选择系统的结构示意图。
具体实施方式
为了使本领域技术人员能进一步了解本发明的特征及技术内容,请参阅以下有关本发明的详细说明与附图,附图仅提供参考与说明,并非用来限制本发明。
下面结合附图和实施例,对本发明的技术方案进行描述。
参照图1,为本发明实施例一种数据源的选择方法流程图。
该选择方法可以包括:
步骤101,建立数据源中结构化数据的属性索引项。
在本实施例中,对于各数据源中的结构化数据按照属性分别根据属性值构建索引,按属性建立属性值的文档频率(df)和词频(tf)值,并把与各属性对应的各数据源中的属性值作为索引信息存在结构化索引库中。
例如,建立餐馆信息的结构化数据包括餐馆名称、地址、联系电话、菜谱、菜系等属性项。各属性索引项中除了包括各数据源中对应各属性的属性值之外,还包括属性值对应的tf和df,如:餐馆名称——“湘江老厨(tf1,df1)、麦当劳(tf2,df2)......”其中,“餐馆名称”为属性,“湘江老厨”、“麦当劳”为该数据源中的对应属性值,(tf1,df1)、(tf2,df2)分别为属性值“湘江老厨”、“麦当劳”的词频值和文档频率值。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华为软件技术有限公司,未经华为软件技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201010252121.7/2.html,转载请声明来源钻瓜专利网。
- 上一篇:影音互动系统及其方法
- 下一篇:服务器档案管理的方法