[发明专利]互联网人物信息的搜索方法及系统有效
申请号: | 201210560062.9 | 申请日: | 2012-12-21 |
公开(公告)号: | CN102968510A | 公开(公告)日: | 2013-03-13 |
发明(设计)人: | 王慧昌;杨宏辉;林胜通;郑汉军 | 申请(专利权)人: | 厦门市美亚柏科信息股份有限公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 北京恒都律师事务所 11395 | 代理人: | 邸建凯 |
地址: | 361008 福建省厦门*** | 国省代码: | 福建;35 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 互联网 人物 信息 搜索 方法 系统 | ||
1.一种互联网人物信息的搜索方法,其特征在于,包括:
获取目标人物信息的查询关键词;
将所述查询关键词处理成元搜索系统所需的搜索请求参数;
启动元搜索系统集成的搜索引擎进行搜索;
提取搜索结果集合的摘要线索;
下载所述搜索结果集合的相关页面;
提取下载页面的正文线索;
优选由所述摘要线索和所述正文线索组成的线索集合;
将优选线索集合作为下一轮搜索的入口参数,重复上述步骤,进行迭代搜索、线索收集;
对经过多次迭代搜索、优选后的线索集合进行关联分析,生成虚拟人物的身份信息。
2.根据权利要求1所述的互联网人物信息的搜索方法,其特征在于,还包括:对搜索结果进行排重和优选处理。
3.根据权利要求1所述的互联网人物信息的搜索方法,其特征在于,所述优选由所述摘要线索和所述正文线索组成的线索集合的步骤,进一步为:
优选由所述摘要线索和所述正文线索组成的线索集合以及外部接口提供的人物资源线索数据库。
4.根据权利要求1所述的互联网人物信息的搜索方法,其特征在于,所述对经过多次迭代搜索、优选后的线索集合进行关联分析,生成虚拟人物的身份信息的步骤,进一步为:
对经过多次迭代搜索、优选后的线索集合,结合外部接口提供的人物资源库线索数据进行关联分析,生成虚拟人物的身份信息。
5.根据权利要求1所述的互联网人物信息的搜索方法,其特征在于,所述搜索结果的记录格式为:Record(RID,title,url,urlID,inTime,docTime,docSummary)。
6.一种互联网人物信息的搜索系统,其特征在于,包括:系统参数配置管理模块、页面信息收集模块、线索搜集模块、关联分析模块;其中,
所述系统参数配置管理模块,用于提供可定制的参数管理,为其它模块提供参数接口服务;
所述页面信息收集模块具体包括:
关键词管理单元,用于获取和管理搜索关键词;
关键词处理单元,用于将所述搜索关键词处理成元搜索系统所需的搜索请求参数;
搜索单元,用于启动元搜索系统集成的搜索引擎进行搜索;
搜索结果存储单元,用于存储搜索结果;
所述线索搜集模块具体包括:
第一提取单元,用于提取搜索结果集合的摘要线索;
页面下载单元,用于下载所述搜索结果集合的相关页面;
第二提取单元,用于提取下载页面的正文线索;
线索优化单元,用于优选由所述摘要线索和所述正文线索组成的线索集合;
线索存储单元,用于存储优化线索集合;
迭代搜索请求单元,用于将所述优化线索集合作为下一轮搜索的入口参数,请求所述页面信息收集模块进行迭代搜索;
所述关联分析模块,用于对经过多次迭代搜索、优选后的线索集合进行关联分析,生成虚拟人物的身份信息。
7.根据权利要求6所述的互联网人物信息的搜索系统,其特征在于,还包括:
插件接口模块,用于为外部资源系统的调用提供接口。
8.根据权利要求6所述的互联网人物信息的搜索系统,其特征在于,所述页面信息收集模块还包括:
搜索结果优化单元,用于对所述搜索结果进行排重和优选处理,得到优化的搜索结果。
9.根据权利要求6所述的互联网人物信息的搜索系统,其特征在于,所述线索收集模块的线索优化单元进一步为:用于对所述摘要线索和所述正文线索组成的线索集合以及外部接口提供的人物资源线索数据库进行优选,得到优先线索集合。
10.根据权利要求6所述的互联网人物信息的搜索系统,其特征在于,所述关联分析模块进一步为:用于对经过多次迭代搜索、优选后的线索集合,结合外部接口提供的人物资源库线索数据进行关联分析,生成虚拟人物的身份信息。
11.根据权利要求6所述的互联网人物信息的搜索系统,其特征在于,所述搜索单元获取的搜索结果的记录格式为:Record(RID,title,url,urlID,inTime,docTime,docSummary)。
12.根据权利要求6所述的互联网人物信息的搜索系统,其特征在于,所述关联分析模块采用基于频繁模式树增长算法的关联规则对线索集合进行关联分析。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于厦门市美亚柏科信息股份有限公司,未经厦门市美亚柏科信息股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201210560062.9/1.html,转载请声明来源钻瓜专利网。
- 上一篇:工装设计辅助装置及方法
- 下一篇:针对GIS的数据缓存方法和系统
- 信息记录介质、信息记录方法、信息记录设备、信息再现方法和信息再现设备
- 信息记录装置、信息记录方法、信息记录介质、信息复制装置和信息复制方法
- 信息记录装置、信息再现装置、信息记录方法、信息再现方法、信息记录程序、信息再现程序、以及信息记录介质
- 信息记录装置、信息再现装置、信息记录方法、信息再现方法、信息记录程序、信息再现程序、以及信息记录介质
- 信息记录设备、信息重放设备、信息记录方法、信息重放方法、以及信息记录介质
- 信息存储介质、信息记录方法、信息重放方法、信息记录设备、以及信息重放设备
- 信息存储介质、信息记录方法、信息回放方法、信息记录设备和信息回放设备
- 信息记录介质、信息记录方法、信息记录装置、信息再现方法和信息再现装置
- 信息终端,信息终端的信息呈现方法和信息呈现程序
- 信息创建、信息发送方法及信息创建、信息发送装置