[发明专利]检索方法和检索系统无效
申请号: | 200910001619.3 | 申请日: | 2009-01-09 |
公开(公告)号: | CN101777046A | 公开(公告)日: | 2010-07-14 |
发明(设计)人: | 谭诚;黄耀海 | 申请(专利权)人: | 佳能株式会社 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 中国国际贸易促进委员会专利商标事务所 11038 | 代理人: | 魏小薇 |
地址: | 日本*** | 国省代码: | 日本;JP |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 检索 方法 检索系统 | ||
技术领域
本发明涉及检索方法和检索系统,具体涉及使用相关反馈技术的检索方法和检索系统。
背景技术
在所有检索系统当中,利用关键词搜索引擎的检索系统是最普遍使用的。随着检索技术的发展,一种利用反馈技术的新的检索方法已越来越有效并且被普遍使用。在这种使用反馈技术的方法中,通过第一次检索获得的前N个文档(N是可以被适当设定的正整数)被用作反馈文档,并且从反馈文档中提取的信息被用于进行下一次检索。
图7是示出在利用相关反馈信息的常规检索系统中所使用的检索过程的流程图。
在步骤S701中,系统获得初始查询式(query),并且基于所述初始查询式执行第一次检索,以便获得结果文档列表,所述结果文档列表可以被返回给用户。可以利用本领域技术人员所知的任何关键词检索方法执行第一次检索,只要通过第一次检索获得的结果文档能够根据指示这些文档与初始查询式的相关程度的分数而被排序即可。
在步骤S703中,列表中的结果文档按照上述分数按降序被排列。系统从文档列表中选择在前的N个文档(前N个文档)作为反馈文档。N是可以由用户任意选择或可以按照其他方式适当设定的正整数。
在步骤S705中,系统对前N个文档进行循环,以通过词法分析器(lexical parser)获得分词(word segment)结果。
在步骤S707中,系统例如根据以下的式1计算反馈文档(前N个文档)中的每个词的相关分数。
(式1)
其中,wj表示前N个文档中的第j个词,wj可以遍历所有前N个文档中的所有词;relevance_score(wj)表示wj的相关分数,其示出词wj与初始查询式的相关程度;doci表示前N个文档中的第i个文档,其中i从1循环到N;word_score(wj,doci)例如是wj在当前文档doci中出现的数量。
在完成每个词的相关分数(即relevance_score(wj))的计算之后,这些词按照相关分数被排序,具有最高相关分数的M个词被选择作为反馈信息。在此,M是根据需要可以由用户选择或者可以由系统自动预先确定的任意正整数。
在步骤S709中,除了初始查询式之外,系统还考虑反馈信息,并且生成新的查询式。例如,系统将步骤S707中所计算的具有最高相关分数的M个词添加到初始查询式中,并且获得新的查询式。
在步骤S711中,系统使用步骤S709中获得的新的查询式来执行第二次检索。
在步骤S713中,系统获得第二次检索结果作为最终检索结果,并且将该结果返回给用户。
关于相关反馈的更多信息在各种文献中公开,诸如Rocchio.J.J.的“Relevance Feedback in Information Retrieval in the SmartSystem-experiments in Automatic Document Processing”,313-323,Englewood Cliffs,NJ:Prentice Hall Inc.,1971;G.Salton和ChrisBuckley的“Improving Retrieval Performance By RelevanceFeedback”,JASIS 41.288-297,CHRI,1990;C.T.YU、W.S.LUKE和T.Y.CHEUNG的“A Statistical Model for Relevance Feedback inInformation Retrieval”,Journal of the Amodation for ComputingMachinery,Vol.23,No.2,1976年4月,pp.273-286。由于相关反馈技术已被本领域技术人员知晓,因此这里将省略对此技术的更详细的描述。
然而,在现有技术中,根据利用相关反馈信息的检索系统的上述处理,系统仅利用了词法分析器的分词结果来计算相关分数,也就是说,在相关分数的计算中仅利用了单个词的信息,但是并没有考虑词之间的依存关系。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于佳能株式会社,未经佳能株式会社许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/200910001619.3/2.html,转载请声明来源钻瓜专利网。