[发明专利]冷启动状态下搜索意图的识别方法在审
申请号: | 201910903614.3 | 申请日: | 2019-09-24 |
公开(公告)号: | CN110688572A | 公开(公告)日: | 2020-01-14 |
发明(设计)人: | 申建平 | 申请(专利权)人: | 四川新网银行股份有限公司 |
主分类号: | G06F16/9535 | 分类号: | G06F16/9535;G06F16/33;G06Q30/06 |
代理公司: | 51282 成都智言知识产权代理有限公司 | 代理人: | 濮云杉 |
地址: | 610094 四川省成都市成都*** | 国省代码: | 四川;51 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明涉及冷启动状态下搜索意图的识别方法,包括:A.定义类别和类别属性;B.标注每个业务词元所属的类别属性;C.计算各业务词元与各类别的相似度值,形成业务词元与相似类别对应的键‑值数据单元;D.根据字典词元提取搜索词的核心词,将核心词与业务词元匹配,得到与核心词相同的业务词元,通过键‑值数据单元得到每个核心词对应的类别列表及类别的相似度值;E.对所有分词进行搜索,并结合类别列表及类别的相似度值,搜索结果是在初次排序结果的基础上加权相似度值,按相似度值由高到低显示。本发明能够在搜索系统刚上线处于冷启动阶段时,不用依赖用户行为数据即可有效识别用户搜索意图,并且不需要大规模繁琐的数据处理过程。 | ||
搜索关键词: | 核心词 相似度 类别属性 数据单元 冷启动 搜索 数据处理过程 用户搜索意图 用户行为数据 加权相似度 定义类别 排序结果 搜索结果 搜索系统 相似类别 有效识别 搜索词 分词 上线 标注 匹配 字典 | ||
【主权项】:
1.冷启动状态下搜索意图的识别方法,其特征包括:/nA.定义与各行业分别对应的类别,以及各类别各自对应的类别属性;/nB.对业务数据库中的业务词元,自动标注每个业务词元所属的多种类别属性;/nC.根据各类别的行业标准,计算出与各类别属性相对应的各业务词元与各类别的相似度值,根据所述的相似度值,形成单个业务词元与多个相似类别对应的键-值数据单元,其中键为业务词元,值为该业务词元对应的类别和相似度值;/nD.根据现有的分词字典中的字典词元对用户输入的搜索词进行匹配和分词,然后根据字典词元已标注的类别属性,从得到的分词中提取出核心词,将核心词与业务词元进行匹配,得到与核心词相同的业务词元,通过所述的键-值数据单元进而得到每个核心词分别对应的类别列表及类别的相似度值;/nE.对搜索词的所有分词结果进行搜索,同时将得到的类别列表及类别的相似度值作为搜索条件传递给搜索引擎,搜索结果是在初次排序结果的基础上对各类别的相似度值进行加权,显示时在初次排序的基础上,按类别的相似度值由高到低顺序显示搜索结果。/n
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于四川新网银行股份有限公司,未经四川新网银行股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201910903614.3/,转载请声明来源钻瓜专利网。