[发明专利]问答式网络导购方法无效
申请号: | 201110051048.1 | 申请日: | 2011-03-03 |
公开(公告)号: | CN102117467A | 公开(公告)日: | 2011-07-06 |
发明(设计)人: | 王进;陈建平;程显毅;王春明;曹小峰 | 申请(专利权)人: | 南通大学 |
主分类号: | G06Q30/00 | 分类号: | G06Q30/00;G06F17/30 |
代理公司: | 南通市永通专利事务所 32100 | 代理人: | 葛雷 |
地址: | 226019*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 问答式 网络 导购 方法 | ||
技术领域
本发明涉及一种网络导购方法。
背景技术
现在的电子商务网站已经提供了搜索功能和详细的分类,只要顾客的购物需求明确,很快就可以找到对应的商品并购买。但是事实上问题是,顾客很多时候购物需求不明确,只有一个大体的购物意向。比如:想买一台电脑,但是不知道什么品牌好、不知道大概买多少价位的合适、不知道买主频多少内存多少的电脑;想买奶瓶,但是不知道是买玻璃的还是塑料的好、不知道配什么样的奶嘴等等。当顾客只有购物意向,而没有明确的购物需求时,顾客往往会通过多种途径咨询,比如百度知道、天涯问答这类的知识共享型网站、搜索引擎、朋友、专家等等。这是一个费时费力的过程。
发明内容
本发明的目的在于提供一种使用方便,效果好的问答式网络导购方法。
本发明的技术解决方案是:
一种问答式网络导购方法,其特征是:设置网络导购自动问答系统模块和推荐系统模块,在网络导购自动问答系统模块中建立商品属性数据库模块和商品选购知识的问答对库模块,在网络导购自动问答系统模块中设置询问引擎模块和回答引擎模块,由商品属性数据库模块通过询问引擎模块向顾客进行询问顾客需要的商品属性,由回答引擎模块接收顾客对商品属性或选购知识的询问,并由回答引擎通过商品属性模块或商品选购知识问答对库模块回答顾客的问题,通过与顾客的问答交流后,由推荐系统模块向顾客推荐商品,使顾客完成购物。
商品选购知识的问答对库模块的建立方法是:首先,使用网络爬虫软件,将“百度知道”的HTML网页转换为DOM树;然后根据文字信息和HTML标签信息设计对各个信息的抽取规则;再从中抽取“问题”和“最佳答案”组成问答对;最后全部的问答对组成一个问答对库,存储到数据库。
回答引擎的功能是产生答案,其首先对顾客的问题进行问句分析,即中文分词,中文分词采用中科院的开源分词系统ICTCLAS,然后进行答案处理,如果顾客询问的是产品的属性,那么回答引擎通过查询“商品的属性数据库”产生答案;如果顾客询问的是选购方面问题,则将问题与问答对库中的问题进行相似度比较,找到问答对库中最相似的问题,取其对应的答案。其中关于相似度的计算方法,采用TFIDF方法(即向量文档法)。
本发明具有“商品属性数据库”和“商品选购知识的问答对库”两个数据库,让顾客在一问一答之中,完成网络购物。使用方便,效果好。
一般的问答系统,只有“答”,没有“问”。而本方案中的问答系统既有“答”,也有“问”。通过“商品属性数据库”向顾客进行询问。通过“商品属性数据库”和“商品选购知识的问答对库”回答顾客的问题。
本方法主要由“问答系统”模块与“推荐系统”模块构成,共同完成网络导购的任务。
“商品选购知识的问答对库”是从第三方的“百度知道”网站上抽取的文本知识建立的,而不是手工建立的。与手工建立的知识库相比,本知识库具有大规模性和公正性。因为,手工建立知识库成本大,一般都是小规模的;而且由于顾客对电子商务商家的信任有限,因此电子商务商家自建的知识库可信度不高。
通过“商品属性数据库”向顾客进行询问,例如:您需要什么价位的电脑、您需要多大内存的电脑;而顾客可能会反问:你有哪些价位的电脑?内存是什么?这时我们分别通过“商品属性数据库”和“商品选购知识的问答对库”回答顾客的问题。
附图说明
下面结合附图和实施例对本发明作进一步说明。
图1是本发明一个实施例的示意图。
具体实施方式
一种问答式网络导购方法,设置网络导购自动问答系统模块1和推荐系统模块6,在网络导购自动问答系统模块中建立商品属性数据库模块2和商品选购知识的问答对库模块3,“商品的属性数据库”。包括商品的分类、型号、颜色、尺寸等等。在网络导购自动问答系统模块中设置询问引擎模块4和回答引擎模块5,由商品属性数据库模块通过询问引擎模块向顾客进行询问顾客需要的商品属性,由回答引擎模块接收顾客对商品属性或选购知识的询问,并由回答引擎通过商品属性模块或商品选购知识问答对库模块回答顾客的问题,通过与顾客的问答交流后,由推荐系统模块向顾客推荐商品,使顾客完成购物。
商品选购知识的问答对库模块的建立方法是:从“百度知道”网站通过信息抽取的方法,抽取与购物有关的问答文本。具体做法为:首先,使用网络爬虫软件,将“百度知道”的HTML网页转换为DOM树;然后根据文字信息和HTML标签信息设计对各个信息的抽取规则;再从中抽取“问题”和“最佳答案”组成问答对;最后全部的问答对组成一个问答对库,存储到数据库。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南通大学,未经南通大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201110051048.1/2.html,转载请声明来源钻瓜专利网。