[发明专利]一种问题推送方法和采用该方法的问答系统和搜索引擎无效
申请号: | 201210022422.X | 申请日: | 2012-02-01 |
公开(公告)号: | CN102609500A | 公开(公告)日: | 2012-07-25 |
发明(设计)人: | 沈文竹;吴甜;柴春光;吴华 | 申请(专利权)人: | 北京百度网讯科技有限公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 北京泛华伟业知识产权代理有限公司 11280 | 代理人: | 王勇 |
地址: | 100085 北京市*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 问题 推送 方法 采用 问答 系统 搜索引擎 | ||
1.一种问题推送方法,包括如下步骤:
1)提取问题的特征词向量;
2)利用问题的特征词向量和用户的特征词向量中的词语,根据词语的类别层次关系,计算问题与用户之间的相似度;
3)根据所计算的相似度,把问题推送给一个或多个用户。
2.根据权利要求1所述的方法,其特征在于,所述步骤1)前还包括:建立所述词语的类别层次关系的步骤。
3.根据权利要求1或2所述的方法,其特征在于,所述词语仅包括名词。
4.根据权利要求1或2所述的方法,其特征在于,对于不同语言的词语,对应词语之间的类别是对应的。
5.根据权利要求2所述的方法,其特征在于,所述建立所述词语的类别层次关系是以应用为导向来进行的。
6.根据权利要求1或2所述的方法,其特征在于,所述步骤2)前还包括:根据用户以前的网络行为提取所述用户的特征词向量的步骤。
7.根据权利要求1或2所述的方法,其特征在于,所述根据用户以前的网络行为提取用户的特征词向量包括:根据用户提交搜索后,在搜索引擎返回的页面中,用户所选择点击的页面的文字信息来提取特征词。
8.根据权利要求1或2所述的方法,其特征在于,所述步骤1)中根据用户以前的网络行为提取用户的特征词向量包括:根据用户在问答系统中提问后,回答页面中的文字信息来提取特征词。
9.根据权利要求1或2所述的方法,其特征在于,所述步骤2)进一步包括:
21)对于用户的特征词向量中的任意词语和问题的特征词向量中的任意词语,根据词语的类别层次关系,计算词语间的相似度;
22)根据所有词语间的相似度,计算问题与用户之间的相似度。
10.根据权利要求9所述的方法,其特征在于,所述步骤22)中计算问题与用户之间的相似度时,根据词语所属最小类别考虑词语间的相似度的权重。
11.根据权利要求1或2所述的方法,其特征在于,所述步骤3)中进一步包括:
31)根据用户个数阈值选择一个或多个用户;
32)把问题推送给所选择的用户。
12.根据权利要求1或2所述的方法,其特征在于,所述步骤3)中进一步包括:
33)根据相似度阈值选择一个或多个用户;
34)把问题推送给所选择的用户。
13.一种问题推送系统,包括:
向量提取模块,用于提取问题的特征词向量;
相似度计算模块,用于利用问题的特征词向量和用户的特征词向量中的词语,根据词语的类别层次关系,计算问题与用户之间的相似度;
问题推送模块,用于根据所计算的相似度,把问题推送给一个或多个用户。
14.根据权利要求13所述的系统,其特征在于,所述系统还包括:
层次建立模块,用于建立所述词语的类别层次关系。
15.根据权利要求13或14所述的系统,其特征在于,所述向量提取模块还用于:根据用户以前的网络行为提取所述用户的特征词向量。
16.根据权利要求13或14所述的系统,其特征在于,所述相似度计算模块进一步包括:
词语相似度计算模块,用于对于用户的特征词向量中的任意词语和问题的特征词向量中的任意词语,根据词语的类别层次关系,计算词语间的相似度;
问题与用户相似度确定模块,用于根据所有词语间的相似度,计算问题与用户之间的相似度。
17.一种问答系统,包括权利要求13至16任一项所述的问题推送系统。
18.一种搜索引擎,包括权利要求17所述的问答系统。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京百度网讯科技有限公司,未经北京百度网讯科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201210022422.X/1.html,转载请声明来源钻瓜专利网。
- 上一篇:高铁专用电加热器
- 下一篇:一种药物组合物及其用途和包装