[发明专利]一种基于行业特征的搜索系统及搜索方法在审

专利信息
申请号: 201810408885.7 申请日: 2018-04-26
公开(公告)号: CN110427547A 公开(公告)日: 2019-11-08
发明(设计)人: 李杨 申请(专利权)人: 观相科技(上海)有限公司
主分类号: G06F16/9535 分类号: G06F16/9535;G06F16/9536
代理公司: 上海宏京知识产权代理事务所(普通合伙) 31297 代理人: 邓文武
地址: 201108 上海市闵*** 国省代码: 上海;31
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 搜索系统 行业特征 画像 搜索 搜索结果 数据处理模块 关键词处理 个性展示 结果优化 模块连接 评分模块 问卷形式 用户映射 展示模块 人群 个性化 客户 优化
【说明书】:

一种基于行业特征的搜索系统,用户画像模块依次与关键词处理与用户映射模块、结果评分模块、结果优化模块、个性化展示模块连接;用户画像模块包括线上调研模块和线下调研模块,线上调研模块和线下调研模块分别与人群搜索画像模块连接,线上调研模块和线下调研模块均采用问卷形式,人群搜索画像模块包括ETL数据处理模块。本发明提供了一种基于行业特征的搜索系统及搜索方法,能确定搜索结果与客户之间的相关性,能优化搜索结果的推荐,解决了个性展示的问题,推广应用具有良好的经济效益和社会效益。

技术领域

本发明属于搜索技术领域,特别涉及一种基于行业特征的搜索系统及搜索方法,用于确定搜索结果与客户之间的相关性。

背景技术

随着互联网规模的迅速发展,人们获取信息的方式越来越多,信息呈爆炸式增长,用户逐渐由信息匮乏走向了信息过载时代,在海量信息中用户很难高效的获取自己相关的信息。为了方便用户快速获取相关信息,网站按照类目进行分类或者提供搜索窗口使其来搜索,但是基于类目的查询只能覆盖较少一部分内容,为此必须要基于搜索对网站搜索进行优化。

第一代搜索引擎是基于万维网的搜索引擎,1994年4月,第一个搜索引擎WebCrawler(http://www.webcrawler.com)在美国诞生,早期搜索引擎主要使用基于文档内容信息的匹配和排序算法,较典型的包括布尔模型、向量空间模型、概率检索模型、模糊集合模型、扩展布尔检索模型等。第一代搜索引擎往往以反馈结果的数量来衡量检索结果的好坏,即求全,然而研究表明,在全球11个主要的搜索引擎中,仅能搜索到国际互联网上全部页面的16%,甚至更低。这主要是因为这些搜索引擎没有及时更新资料;同时,第一代搜索引擎检索结果的相关性较差,检索结果数量通常超过用户的接受能力,且排序缺乏合理性,用户往往找不到与检索提问最相关的结果。

1998年,随着Google的出现,第二代搜索引擎诞生。第二代搜索引擎依靠机器抓取,建立在超链分析基础之上,提高了查准率,检索思想、方法和目标有了根本性的改变。在信息检索过程中仍存在以下几个主要问题:1).查全率低。在现有的搜索引擎当中还没有一种能覆盖整个因特网的信息资源,Google所收录的网页数急剧下降,这里说的下降不是从90%降到80%之类的,而是几万页、几十万页降到几百页;2).查准率低。现有搜索引擎的检索结果相关性不高,对检索到的信息仅采取机械的关键词匹配,不能理解自然语言,缺乏知识处理能力,导致对信息的判断力较差,往往造成信息丢失,检索结果存在大量垃圾,常出现答非所问的情况。当用户查找某个关键词的时候,所有在页面内容中包含了该关键词的网页都将作为搜索结果被搜出来。在经过复杂的算法进行排序(或者包含商业化的竞价排名、商业推广、或者广告)后,这些结果将按照与搜索关键词的相关度高低(或与相关度毫无关系),依次排列。

2003年8月20日,中国搜索CEO陈沛首次提出了第三代搜索引擎的概念。

用户在使用搜索引擎时,搜索引擎是无法得知用户当前使用场景。搜索引擎排序的逻辑是根据用户关键词与页面中内容在经过复杂的算法进行排序(或者包含商业化的竞价排名、商业推广、或者广告)后,这些结果将按照与搜索关键词的相关度高低展现给客户。这些忽略使用场景的搜索解决很大程度是无法满足用户需求的,例如当一个IT从业人员搜索调度的时候其实想获取的是关于软件开发中调度的设计思路,但是一个制造业搜索调度时关心的可能是车辆调度或者工作安排调度等情况。然而用户点击了相关链接之后,多次搜索关键字返回的结果并没有变化,这其实从一定程度上无法后期针对用户进行个性化的搜索结果推荐。

除此之外,单纯的从查全率以及查准率并无法吸引用户,因为搜索发展至今,大体上技术已经相对成熟,不同搜索引擎之间具体的结果差距较小,如果利用搜索引擎来合理的展示结果,从而提高用户的留存率以及召回率,也是当前需要考虑的问题。

目前第三代搜索引擎研究多基于技术驱动型理念,从技术的角度改进搜索引擎来更好地满足用户需求。而基于行业特征的个性化搜索能力仍然是第三代搜索引擎的发展趋向。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于观相科技(上海)有限公司,未经观相科技(上海)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201810408885.7/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top