|
钻瓜专利网为您找到相关结果 6个,建议您 升级VIP下载更多相关专利
- [发明专利]全文检索方法及系统-CN200810126025.0无效
-
张红彬;周斯
-
全国组织机构代码管理中心
-
2008-07-01
-
2010-01-06
-
G06F17/30
- 本发明涉及一种全文检索方法,包括以下步骤:接收包括检索词的检索表达式,并对检索词进行分词处理;根据分词处理后得到的词条在全文数据库中的VIF文件中查找词条在全文数据库中的BIF文件中的位置信息;根据位置信息在BIF文件中查找与词条对应的记录信息;根据记录信息在全文数据库中的BAF文件中提取对应的数据信息作为检索结果。本发明还涉及一种全文检索系统,包括:BAF文件存储模块、BIF文件存储模块、VIF文件存储模块、分词模块和检索模块。本发明在BIF文件中采用了倒排文件索引技术,由于散列码的唯一性检索时可以迅速的找到被检索信息,并通过对BIF文件进行连符的索引,保证了检索时达到高度的查全率和查准率。
- 全文检索方法系统
- [发明专利]信息采集方法及系统-CN200810126496.1无效
-
蓝培瑜
-
全国组织机构代码管理中心
-
2008-07-04
-
2010-01-06
-
G06F17/30
- 本发明涉及一种信息采集方法,包括:根据预设的采集任务模板从互联网上获取符合采集要求的一个或多个网页链接地址;对一个或多个网页链接地址执行去重操作,并将去重结果存入地址列表数据文件;修补地址列表数据文件所对应的内容信息的HTML标签,并对修补后的网页内容进行文本信息提取;对提取的文本信息进行自动分类,然后对分类后的文本信息进行分词处理,并提取文本信息的摘要;将文本信息的分类结果、分词操作得到的词条以及摘要输出。本发明还涉及一种信息采集系统。本发明在信息采集过程中通过对网页中的内容信息进行HTML标签的修补,实现对各种网页格式的内容的采集;通过对网页链接地址进行哈希转换,增加网页链接地址去重的效率。
- 信息采集方法系统
|