[发明专利]一种问题推送方法和采用该方法的问答系统和搜索引擎无效

专利信息
申请号: 201210022422.X 申请日: 2012-02-01
公开(公告)号: CN102609500A 公开(公告)日: 2012-07-25
发明(设计)人: 沈文竹;吴甜;柴春光;吴华 申请(专利权)人: 北京百度网讯科技有限公司
主分类号: G06F17/30 分类号: G06F17/30
代理公司: 北京泛华伟业知识产权代理有限公司 11280 代理人: 王勇
地址: 100085 北京市*** 国省代码: 北京;11
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 问题 推送 方法 采用 问答 系统 搜索引擎
【说明书】:

技术领域

发明涉及数字信息处理领域,更具体地,涉及数字信息检索领域。

背景技术

在问答类系统中,一个完整的问题页面包括一个用户提出的问题,以及其他用户对该问题给出的一个或多个答案。当有用户在问答类系统中查询新的问题时,该系统需要将新问题推送给不同的用户以获得解答,并将解答返回给提问用户。为了保证问题答复的准确、高效,系统需要将问题推送给有可能能够回答出该问题的用户。因此,问题推送是问答类系统不可回避的一个问题。

现有的问题推送技术是基于检索词的,也就是说,一般依据问题中的特征词与用户之间的相似程度来选择被推送的用户。

具体而言,根据用户以前的网络行为为每个用户建立唯一的特征模型;对于用户提出的新问题,计算问题的特征词与每个用户特征模型之间的相似度;当相似度较高时,则将该新问题推送给特征模型所对应的用户,以让用户给出理想答案。

上述基于检索词的问题推送方法确定的被推送用户不够准确和全面。不够准确体现在:例如,假设一个用户A曾经回答关于“苹果电脑”的问题,那该用户的特征模型中可能包含特征词“苹果”。如果另一用户B提交了个“苹果多少钱一斤”的新问题,那么基于检索词的方法,该新问题将被推送给用户A,但该用户A的选择显然是不准确的。不够全面体现在:假设一个用户A的特征模型中包含“兰蔻”这一特征词,而另一用户B提交了关于“香奈儿”的问题,由于这两者没有相似性,所以基于检索词的问题推送方法不可能将该关于“香奈儿”的问题推送给A。但事实上,通常包含这些特征词的特征模型所对应的用户通常对化妆品会比较了解,也就是说,他们很有可能能够给出关于“香奈儿”的问题的答案。

由于语言文字的多样性,问答系统并不能限定用户所输入的新问题的语言格式,因此实质内容上相同的一个问题会用多种语言表达。而现有的基于检索词的问题推送方法也无法对这种情况进行合理的推送。

发明内容

为解决上述技术问题,本发明的目的在于提供一种能够准确、全面地选择推送对象的问题推送方法。

根据本发明一个方面,提供了一种问题推送方法,包括如下步骤:

1)提取问题的特征词向量;

2)利用问题的特征词向量和用户的特征词向量中的词语,根据词语的类别层次关系,计算问题与用户之间的相似度;

3)根据所计算的相似度,把问题推送给一个或多个用户。

根据本发明另一方面,提供了一种问题推送系统,包括:

向量提取模块,用于提取问题的特征词向量;

相似度计算模块,用于利用问题的特征词向量和用户的特征词向量中的词语,根据词语的类别层次关系,计算问题与用户之间的相似度;

问题推送模块,用于根据所计算的相似度,把问题推送给一个或多个用户。

根据本发明又一方面,提供了一种问答系统,包括上述的问题推送系统。

根据本发明再一方面,提供了一种搜索引擎,包括上述的问答系统。

利用本发明所提供的问题推送方法可以准确、全面地选择被推送的用户。将该方法应用于问答系统中,尤其是搜索引擎的问答系统中,可以提高回答的准确性和时效性,有效节省网络资源。

附图说明

图1是根据本发明一个优选实施例的问题推送方法流程图;

图2是根据本发明一个优选实施例的层次关系图的局部示意图。

具体实施方式

为了使本发明的目的、技术方案及优点更加清楚明白,以下结合附图,对根据本发明一个实施例的问题推送方法和采用该方法的问答系统和搜索引擎进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。

本发明通过词的类别来确定词与词之间的相似度,而与语言等其他因素无关,以此来保证可以准确、全面地选择推送用户。下面将结合图1的流程图,详细描述根据本发明优选实施例的问题推送方法。

首先,建立词语的类别层次关系。为了减小计算量,提高效率,优选地,所述词语仅包括名词。对于不同语言的词语,优选地,各个语言的词语之间的类别是一一对应的。优选,离线地建立该词语的类别层次关系。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京百度网讯科技有限公司,未经北京百度网讯科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201210022422.X/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top