[发明专利]一种模糊概念的语义检索系统及方法有效
申请号: | 201410140317.5 | 申请日: | 2014-04-09 |
公开(公告)号: | CN103886099B | 公开(公告)日: | 2017-02-15 |
发明(设计)人: | 杨小平;何伟;廖俊宇;庄巧娟 | 申请(专利权)人: | 中国人民大学 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 北京纪凯知识产权代理有限公司11245 | 代理人: | 徐宁,关畅 |
地址: | 100872 北京市*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明涉及一种模糊概念的语义检索系统及方法,其特征在于它包括由人机交互界面构成的应用层、由预处理模块、查询转换模块、本体扩展器、查询处理模块和定制处理模块构成的业务逻辑层以及由若干索引信息库构成的数据层;用户通过人机交互界面将查询请求提交给预处理模块进行预处理后,生成一原始的检索词集并提交给查询转换模块;查询转换模块对接收到的检索词集进行模糊概念转换,生成扩展后的同义检索词集和可供选择的语义相关检索词集,并分别提交给查询处理模块和定制处理模块;查询处理模块对索引信息库进行检索并将检索结果提交给定制处理模块;定制处理模块对检索结果以及可供选择的语义相关检索词集进行处理后,提交给人机交互界面。 | ||
搜索关键词: | 一种 模糊 概念 语义 检索系统 方法 | ||
【主权项】:
一种模糊概念的语义检索系统,其特征在于:它包括应用层、业务逻辑层和数据层;所述应用层包括人机交互界面;所述业务逻辑层包括预处理模块、查询转换模块、本体扩展器、查询处理模块和定制处理模块;所述数据层包括若干索引信息库;用户通过所述人机交互界面将查询请求提交给所述预处理模块;所述预处理模块对查询请求进行预处理后生成一原始的检索词集,并将该检索词集提交给所述查询转换模块;所述查询转换模块通过由所述本体扩展器支持更新的本体库对接收到的检索词集进行模糊概念转换,并完成查询优化扩展,生成扩展后的同义检索词集和可供选择的语义相关检索词集,所述查询转换模块将扩展后的同义检索词集提交给所述查询处理模块,并将可供选择的语义相关检索词集提交给所述定制处理模块;根据扩展后的同义检索词集,所述查询处理模块对所述索引信息库进行检索,检索结果返回所述查询处理模块;所述查询处理模块将返回的检索结果提交给所述定制处理模块;所述定制处理模块对接收到的检索结果以及可供选择的语义相关检索词集进行处理后,提交给所述人机交互界面,供用户查看检索结果,并通过语义相关检索词集进行二次检索;所述本体扩展器包括文档收集器、文本预处理器、候选概念生成器、扩展概念生成器、外部资源库、扩展概念添加器和本体扩展评价;所述文档收集器通过概念间的语义匹配约束,过滤与已有种子本体概念无关的内容,从网络中收集与已有种子本体概念相关的文本并提交给所述文本预处理器;所述文本预处理器通过加入分词词集支持对收集到的文本进行文本预处理操作,经文本预处理操作后的文本提交给所述候选概念生成器;所述候选概念生成器从预处理后的文本中抽取与种子本体概念紧密相关的概念,并将其作为候选概念提交给所述扩展概念生成器;所述外部资源库为用户提供种子本体,并将种子本体提交给所述扩展概念生成器;所述扩展概念生成器通过词语共现分析并根据接收到的候选概念和种子本体生成扩展概念,并提交给所述扩展概念添加器;所述扩展概念添加器通过改进的包含分析和本体扩展规则将接收到的扩展概念添加至种子本体中,更新种子本体的内容,完成种子本体的扩展;更新后的种子本体传输至所述文档收集器和文本预处理器中并参与下一个本体扩展过程,扩展后本体提交给所述本体扩展评价器,由所述本体扩展评价器对扩展后本体进行评价。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国人民大学,未经中国人民大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201410140317.5/,转载请声明来源钻瓜专利网。
- 上一篇:一种测量仪器三脚架防滑垫
- 下一篇:一种电气连接结构