[发明专利]一种基于词表的信息搜索方法及搜索系统无效
申请号: | 201210002697.7 | 申请日: | 2012-01-06 |
公开(公告)号: | CN103198066A | 公开(公告)日: | 2013-07-10 |
发明(设计)人: | 王沁泉;王佳强;杨娜;胡文翠;潘树燊;文勖 | 申请(专利权)人: | 腾讯科技(深圳)有限公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 北京鑫媛睿博知识产权代理有限公司 11297 | 代理人: | 龚家骅 |
地址: | 518057 广东省深圳*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 词表 信息 搜索 方法 系统 | ||
技术领域
本发明涉及通信技术领域,特别是涉及一种基于词表的信息搜索方法及搜索系统。
背景技术
随着实时信息网络和内容发布工具以及多媒体设备的发展,各种各样的信息越来越多,搜索作为一种获取信息的重要手段,使得用户在丰富的信息资源中能够快速找到所需要的信息,并成为信息时代不可或缺的重要工具。
目前在互联网上存在以下几种常见的信息安全问题:敏感信息、色情内容、社会争议性事件、违禁物品信息、赌博类信息、诈骗内容、非法广告信息等。这些不健康的信息使信息检索的安全性受到了挑战,为了保证输出的搜索结果符合要求,搜索采取了安全策略。
目前的搜索系统,对于词表中不同主题词统一采用同一种安全策略,即词表仅对应设置一种安全策略,安全策略包括例如,不返回敏感词搜索结果、直接返回敏感词搜索结果或者返回过滤后的敏感词搜索结果。因此,如果制定的安全策略的安全等级较高,会过滤全部敏感信息,不返回敏感词搜索结果,这样会将安全等级较低的敏感信息也全部过滤掉;如果制定的安全策略的安全等级较低,则会在搜索结果中返回全部或部分安全等级较高的敏感词搜索结果。
这已经越来越不满足现有的搜索需求,无法根据不同的搜索需求对搜索结果进行安全性控制。
发明内容
本发明的目的在于提供一种基于词表的信息搜索方法及搜索系统,用以解决采用同一安全策略导致的搜索结果可控性及灵活性无法保证的问题。
为此,本发明实施例采用如下技术方案:
本发明实施例提供一种基于词表的信息搜索方法,所述词表中的主题词具有各自的安全等级,各安全等级对应设置有相应的安全策略;所述方法包括:
搜索系统接收包含有关键词的搜索请求;
所述搜索系统根据所述关键词,在所述词表中进行查询,得到匹配的主题词;
所述搜索系统根据匹配到的主题词进行搜索,并根据匹配到的主题词对应的安全等级,确定该安全等级对应的安全策略,根据该安全策略得到所述主题词的搜索结果。
本发明实施例提供一种基于词表的信息搜索系统,所述词表中的主题词具有各自的安全等级;所述搜索系统包括:存储模块、接收模块、查询模块、安全模块以及输出模块,其中,
存储模块,用于存储安全等级与安全策略的对应关系;
接收模块,用于接收包含有关键词的搜索请求;
查询模块,用于根据所述接收模块接收到的关键词在所述词表中进行查询,得到匹配的主题词;
安全模块,用于根据所述查询模块匹配到的主题词的安全等级,以及所述存储模块存储的对应关系,确定该安全等级对应的安全策略;
搜索模块,用于根据匹配到的主题词进行搜索,并根据所述安全模块确定的安全策略得到所述主题词的搜索结果。
与现有技术相比,本发明的实施例具有如下优点:
本发明的实施例中,词表中的主题词具有各自的安全等级,各安全等级对应设置有相应的安全策略,当用户发起搜索时,搜索系统根据关键词在词表中进行查询,得到匹配的主题词,并根据匹配到的主题词进行搜索,根据匹配到的主题词对应的安全等级,确定该安全等级对应的安全策略,并根据该安全策略得到主题词的搜索结果,从而使不同安全等级的主题词可以执行不同的安全策略,获得不同的搜索结果,保证了搜索结果在安全性要求方面的可控性,以及搜索结果的灵活性。
附图说明
图1为本发明实施例提供的基于词表的信息搜索方法流程示意图;
图2为本发明实施例提供的基于词表的信息搜索系统的结构框图。
具体实施方式
下面将结合本发明中的附图,对本发明中的技术方案进行清楚、完整的描述,显然,所描述的实施例是本发明的一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动的前提下所获得的所有其他实施例,都属于本发明保护的范围。
本发明实施例中,词表中的每个主题词具有各自的安全等级,即安全等级作为主题词的一个属性而存在。各安全等级对应设置有相应的安全策略。安全等级可以根据实际需要进行划分,例如,敏感信息、色情内容、社会争议性事件、部分违禁物品、赌博类信息、诈骗内容、非法广告信息等对社会的危害程度不同,在建立词表时,为词表中的各主题词设置各自的安全等级。例如,将涉及诈骗内容的主题词的安全等级设置为最高,将涉及非法广告信息的主题词安全等级设置为次之。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于腾讯科技(深圳)有限公司,未经腾讯科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201210002697.7/2.html,转载请声明来源钻瓜专利网。
- 信息记录介质、信息记录方法、信息记录设备、信息再现方法和信息再现设备
- 信息记录装置、信息记录方法、信息记录介质、信息复制装置和信息复制方法
- 信息记录装置、信息再现装置、信息记录方法、信息再现方法、信息记录程序、信息再现程序、以及信息记录介质
- 信息记录装置、信息再现装置、信息记录方法、信息再现方法、信息记录程序、信息再现程序、以及信息记录介质
- 信息记录设备、信息重放设备、信息记录方法、信息重放方法、以及信息记录介质
- 信息存储介质、信息记录方法、信息重放方法、信息记录设备、以及信息重放设备
- 信息存储介质、信息记录方法、信息回放方法、信息记录设备和信息回放设备
- 信息记录介质、信息记录方法、信息记录装置、信息再现方法和信息再现装置
- 信息终端,信息终端的信息呈现方法和信息呈现程序
- 信息创建、信息发送方法及信息创建、信息发送装置