[发明专利]一种按语义搜索关键词的方法和装置有效
| 申请号: | 201910433774.6 | 申请日: | 2019-05-23 |
| 公开(公告)号: | CN110209765B | 公开(公告)日: | 2021-03-30 |
| 发明(设计)人: | 程波 | 申请(专利权)人: | 武汉绿色网络信息服务有限责任公司 |
| 主分类号: | G06F16/33 | 分类号: | G06F16/33;G06F16/953;G06F40/289;G06F40/30 |
| 代理公司: | 深圳市六加知识产权代理有限公司 44372 | 代理人: | 向彬 |
| 地址: | 430000 湖北省武汉市东湖新技术开*** | 国省代码: | 湖北;42 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 按语 搜索关键词 方法 装置 | ||
1.一种按语义搜索关键词的方法,获取待搜索关键字和各待搜索目标对象的流量数据,并通过匹配所述待搜索关键字和流量数据,得到初始匹配结果,其中,所述初始匹配结果包括各流量数据中对应待搜索关键字的上下文信息内容,其特征在于,包括:
按照预设拆分规则,拆分所述初始匹配结果中的上下文信息内容,得到至少两组词条对象;
根据所述待搜索目标对象的属性信息,获取对应的词跳转概率表;
根据每一组词条对象中所包含的各词条先后顺序,查找所述词跳转概率表,得到每一组词条对象的成立概率;
根据各组词条的成立概率,筛选所述初始匹配结果,得到筛选后的匹配结果;
所述待搜索关键字为X1,X2,…,Xn-1,Xn,其中,Xi代表一字符,i∈[1,n];所述预设拆分规则,具体包括:
将所述匹配结果中的上下文信息内容,按照以下拆分方式中的至少两种进行拆分,得到至少两组词条对象;其中,拆分方式包括:
拆分方式一:上下文信息内容中,在词库中匹配,由X1与其前一个字符构成的词条,若匹配上则记为W2,若不能匹配上,则X1被认定为一个词,记为W2;在上下文信息内容中位于W2之前继续寻找一个词,记为W1;其中,X2,…,Xn-1,Xn记为W3,在上下文信息内容中,位于X2,…,Xn-1,Xn之后找出一个词,记为W4;此时,得到一组词条对象,记为W1W2W3W4;
拆分方式二:在上下文信息内容中,位于X1,X2,…,Xn-1之前寻找一个词,记为C1;所述X1,X2,…,Xn-1记为C2;对Xn做后向组合匹配,找出最长匹配的词,记为C3,在C3之后继续往后找到一个词,记录为C4;此时,得到一组词条对象,记为C1C2C3C4;
拆分方式三:把X1,X2,…,Xn-1,Xn做为一个词,记为M2;在上下文信息内容中,位于X1之前寻找一个词,记为M1;在上下文信息内容中,位于Xn之后寻找两个词,记为M3和M4;此时,得到一组词条对象,记为M1M2M3M4;
拆分方式四:把X1,X2,…,Xn-1,Xn做为一个词,记为N3;在上下文信息内容中,位于X1之前寻找两个词,记为N1和N2;在上下文信息内容中,位于Xn之后寻找一个词,记为N4;此时,得到一组词条对象,记为N1N2N3N4。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于武汉绿色网络信息服务有限责任公司,未经武汉绿色网络信息服务有限责任公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910433774.6/1.html,转载请声明来源钻瓜专利网。





