[发明专利]一种基于产品信息结构化的Web问答检索系统有效
申请号: | 201310354888.4 | 申请日: | 2013-08-14 |
公开(公告)号: | CN103440287A | 公开(公告)日: | 2013-12-11 |
发明(设计)人: | 郝志峰;温雯;蔡瑞初;王鸿飞;张奇;张鑫;刘建明;王宗武 | 申请(专利权)人: | 广东工业大学 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 广州粤高专利商标代理有限公司 44102 | 代理人: | 林丽明 |
地址: | 510006 广东省广*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明是一种基于产品信息结构化的Web问答检索系统。包括用户接口、产品信息爬取模块、信息抽取模块、倒排索引建立模块、数据库接口、信息整合模块、问句处理模块、数据库,本发明能实时获得线上产品信息的最新情况,并通过信息抽取和整合模块,能够及时对数据库中已有的结构化产品数据进行更新或增加新的结构化产品数据,使得系统能够适应线上产品信息的变化。另外,本发明从多个产品信息网站对产品信息进行采集,并通过信息抽取和整合模块,对同一产品在不同网站上的产品信息进行整合,对矛盾的信息进行判断,对缺少的信息进行不同信息源间的互补,确保检索信息的完整性和真实性。本发明是一种具有较高的检索效率的基于产品信息结构化的Web问答检索系统。 | ||
搜索关键词: | 一种 基于 产品信息 结构 web 问答 检索系统 | ||
【主权项】:
一种基于产品信息结构化的Web问答检索系统,其特征在于包括有用户接口、产品信息爬取模块、信息抽取模块、倒排索引建立模块、数据库接口、信息整合模块、问句处理模块、数据库,其中,用户接口,用于实现Web问答系统与用户的各种通信,包括获取用户输入的产品相关自然语言问句并将问句传递给问句处理模块;将对应的搜索结果以及相关网页返回给用户;产品信息爬取模块,用于按照一定时间间隔对网页进行爬取,并将爬取的网页进行存储,传递给信息抽取模块进行处理;信息抽取模块,用于对产品信息爬取模块爬取网页中的非结构化网页信息进行处理,将这些非结构化信息转化为结构化信息,并通过数据库接口与结构化产品信息数据建立连接,将处理好的结构化信息存储在数据库中;倒排索引建立模块,用于从产品信息爬取模块爬取的网页中提取关键内容,并对这些网页建立倒排索引;数据库接口,实现结构化产品数据的存取、更新数据库操作的统一接口及访问权限控制;信息整合模块,用于整合信息抽取模块输出的多个数据来源结构化信息,并将整合后的结构化数据通过数据库接口与数据库建立连接,保存到数据库中;问句处理模块,用于将用户输入的自然语言问句转化为结构化的语句,该模块通过用户接口与用户建立连接获取用户输入的自然语言问句,并通过数据库接口与数据库建立连接,使用转化后得到的语句在数据库中进行查询,并通过用户接口将语句的查询结果反馈给用户。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于广东工业大学,未经广东工业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201310354888.4/,转载请声明来源钻瓜专利网。