[发明专利]一种优化问答对的搜索排名的装置和方法有效
申请号: | 201310495881.4 | 申请日: | 2013-10-21 |
公开(公告)号: | CN103577558B | 公开(公告)日: | 2017-04-26 |
发明(设计)人: | 孙林;陈培军;秦吉胜 | 申请(专利权)人: | 北京奇虎科技有限公司;奇智软件(北京)有限公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 北京市隆安律师事务所11323 | 代理人: | 权鲜枝 |
地址: | 100088 北京市西城区新*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 优化 答对 搜索 排名 装置 方法 | ||
1.一种优化问答对的搜索排名的装置,该装置包括:
问答知识库,适于存储多条问答知识记录;
搜索单元,适于接收使用者的搜索请求,根据使用者的搜索请求,获取与搜索请求匹配的多个待分析问答对;
相关联程度计算单元,适于根据问答知识库获取每个待分析问答对的相关联程度;
搜索排名单元,适于根据所述待分析问答对的相关联程度优化所述待分析问答对的搜索排名;
该装置还包括,问答知识库构建单元,
所述问答知识库构建单元,适于预先从含有问答对的网页提取出多个问答对,根据提取的问答对构建包括多条问答知识记录的问答知识库;
所述问答知识库构建单元,进一步适于在从含有问答对的网页提取出多个问答对时,抓取与所述问答对对应的类别;
所述问答知识库构建单元,进一步适于在根据提取的问答对构建问答知识库时,根据问答对和与所述问答对对应的类别构建问答知识记录;每个问答知识记录对应于一个类别,分别包括一个问题词语、一个答案词语,以及所述问题词语和所述答案词语之间的语义相关度。
2.根据权利要求1所述的装置,其中,所述相关联程度计算单元包括:
词语提取子单元,适于对待分析的问答对的问题内容和答案内容进行词语提取操作,得到至少一个待分析问题词语和至少一个待分析答案词语;
计算子单元,适于根据待分析问题词语和待分析答案词语,从问答知识库选择至少一条问答知识记录,根据所选择的问答知识记录计算待分析的问答对的相关联程度。
3.根据权利要求1所述的装置,其中,
所述搜索排名单元,适于以所述待分析问答对的相关联程度的次序作为所述待分析问答对的搜索排名。
4.根据权利要求2所述的装置,其中,
所述计算子单元,适于选取其包括的问题词语与待分析问题词语匹配且包括的答案词语与待分析答案词语匹配的问答知识记录;根据选取的问答知识记录中对应于相同类别的问答知识记录,得到该待分析的问答对针对各个类别的相关联程度;选取上述该待分析的问答对针对各个类别的相关联程度的最大值,以该最大值作为待分析的问答对的相关联程度。
5.根据权利要求2所述的装置,其中,
所述计算子单元,适于将选取的问答知识记录中对应于相同类别的问答知识记录的语义相关度加权相加,得到该待分析的问答对分别针对各个类别的相关联程度。
6.根据权利要求2所述的装置,其中,
所述词语提取子单元,适于对待分析的问答对的问题内容和答案内容进行分词、去除停用词、词合并,和提取实体词的操作。
7.根据权利要求1至3任一项所述的装置,其中,
所述问答知识库构建单元,适于对每个问答对执行以下操作:对该问答对的问题内容和答案内容进行词语提取操作,得到问题词语集合和答案词语集合;令问题词语集合中的每个问题词语与答案词语集合中的每个答案词语分别在与该问答对对应的每个类别上形成一条信息记录;
所述问答知识库构建单元,适于对每一条信息记录,执行以下操作:计算该答案词语属于该问答对对应的类别的概率,计算在该问答对对应的类别上该答案词语对该问题词语的解释的专一程度,计算在该问答对对应的类别上该问题词语用该答案词语进行解释的强度;将上述概率、专一程度和强度相乘,所得到的乘积是该答案词语和该问题词语的语义相关度;令该问题词语、该答案词语和其语义相关度形成一条对应于该问答对对应的类别的问答知识记录。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京奇虎科技有限公司;奇智软件(北京)有限公司,未经北京奇虎科技有限公司;奇智软件(北京)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201310495881.4/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种保存数据库日志的方法、装置及系统
- 下一篇:电网设备数据校验方法