[发明专利]一种对例句检索结果进行排序的方法和装置有效
申请号: | 201110303382.1 | 申请日: | 2011-10-09 |
公开(公告)号: | CN102346777A | 公开(公告)日: | 2012-02-08 |
发明(设计)人: | 刘占一;吴华;王海峰 | 申请(专利权)人: | 北京百度网讯科技有限公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 深圳市威世博知识产权代理事务所(普通合伙) 44280 | 代理人: | 何青瓦;李庆波 |
地址: | 100085 北京市*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 例句 检索 结果 进行 排序 方法 装置 | ||
1.一种对例句检索结果进行排序的方法,其特征在于,所述方法包括:
A.获取用户的查询词;
B.从句库中检索包含所述查询词的匹配例句;
C.计算所述查询词与各个匹配例句之间的搭配强度,其中所述查询词与匹配例句之间的搭配强度由所述查询词与匹配例句中除所述查询词之外的其他词之间的搭配概率确定,词语之间的搭配概率是指词语之间形成搭配关系的可能性;
D.按照所述查询词与匹配例句之间的搭配强度的大小对各个匹配例句进行排序。
2.根据权利要求1所述的方法,其特征在于,所述句库包括单语句库或双语句库。
3.根据权利要求1所述的方法,其特征在于,所述查询词与匹配例句之间的搭配强度等于:所述查询词与匹配例句中除所述查询词之外的其他词之间的搭配概率之和与所述匹配例句包含的词语个数的比值。
4.根据权利要求1所述的方法,其特征在于,所述查询词与匹配例句之间的搭配强度等于:所述查询词与匹配例句中除所述查询词之外的其他词之间的搭配概率中最大的N个值之和与N的比值,其中N为正整数且N小于匹配例句包含的词语个数。
5.根据权利要求1所述的方法,其特征在于,所述方法进一步包括对排序后的各个匹配例句进行展示。
6.根据权利要求5所述的方法,其特征在于,如果所述句库为双语句库,则在展示排序后的各个匹配例句时,展示各个匹配例句在所述双语句库中互为译文的另一语言的例句。
7.根据权利要求5所述的方法,其特征在于,所述方法进一步包括在各个匹配例句中标识与所述查询词之间的搭配概率大于设定阈值的词语,以供标识的词语进行突出显示。
8.根据权利要求5所述的方法,其特征在于,所述方法进一步包括:
E1、确定各个匹配例句中与所述查询词之间的搭配概率大于设定阈值的词语;
E2、按照预设的分类策略,对步骤E1确定的各词语分别与所述查询词组合形成的各搭配词对进行分类,并在各类别下按照所述搭配词对在所有匹配例句中出现的次数对各搭配词对进行排序并展示。
9.根据权利要求8所述的方法,其特征在于,所述分类策略包括:
将具有相同词性组合的搭配词对分为一个类别;或者,
将所述查询词在搭配词对中具有相同词性的搭配词对分为一个类别;或者,
将所有的搭配词对分为一个类别。
10.一种对例句检索结果进行排序的装置,其特征在于,所述装置包括:
接收单元,用于获取用户的查询词;
检索单元,用于从句库中检索包含所述查询词的匹配例句;
计算单元,用于计算所述查询词与各个匹配例句之间的搭配强度,其中所述查询词与匹配例句之间的搭配强度由所述查询词与匹配例句中除所述查询词之外的其他词之间的搭配概率确定,词语之间的搭配概率是指词语之间形成搭配关系的可能性;
排序单元,用于按照所述查询词与所述匹配例句之间的搭配强度的大小对各个匹配例句进行排序。
11.根据权利要求10所述的装置,其特征在于,所述句库包括单语句库或双语句库。
12.根据权利要求10所述的装置,其特征在于,所述查询词与匹配例句之间的搭配强度等于:所述查询词与匹配例句中除所述查询词之外的其他词之间的搭配概率之和与匹配例句包含的词语个数的比值。
13.根据权利要求10所述的装置,其特征在于,所述查询词与匹配例句之间的搭配强度等于:所述查询词与匹配例句中除所述查询词之外的其他词之间的搭配概率中最大的N个值之和与N的比值,其中N为正整数且小于匹配例句包含的词语个数。
14.根据权利要求10所述的装置,其特征在于,该装置还包括:展示单元,用于对排序后的各个匹配例句进行展示。
15.根据权利要求14所述的装置,其特征在于,如果所述句库为双语句库,所述展示单元在展示排序后的各个匹配例句时,展示各个匹配例句在所述双语句库中互为译文的另一语言的例句。
16.根据权利要求14所述的装置,其特征在于,该装置还包括:标识单元,用于在各个匹配例句中标识与所述查询词之间的搭配概率大于设定阈值的词语,以供标识的词语进行突出显示。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京百度网讯科技有限公司,未经北京百度网讯科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201110303382.1/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种不确定数据上的多准则信息处理方法
- 下一篇:人膀胱癌细胞系