[发明专利]一种基于用户的个性化数据搜索方法和装置在审
申请号: | 201610203900.5 | 申请日: | 2016-04-01 |
公开(公告)号: | CN107291753A | 公开(公告)日: | 2017-10-24 |
发明(设计)人: | 李晓菲 | 申请(专利权)人: | 阿里巴巴集团控股有限公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 北京润泽恒知识产权代理有限公司11319 | 代理人: | 赵娟 |
地址: | 英属开曼群岛大开*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 用户 个性化 数据 搜索 方法 装置 | ||
技术领域
本申请实施例涉及数据处理技术领域,特别是涉及一种基于用户的个性化数据搜索方法和一种基于用户的个性化数据搜索装置。
背景技术
随着大数据时代的到来,企业收集到的数据越来越多,与此同时,要在海量数据中找到所需数据往往如大海捞针一般,费时费力。目前,大部分企业存储的数据表基本都是以英文名称、英文缩略词进行存储,而用户在搜索数据时,是根据自己的语言习惯,使用中文全称或英文全称进行搜索。
用户在大数据平台上使用搜索关键词进行搜索时,最快得到搜索结果的方式是,按照数据表名称全匹配方式进行搜索,当然,所有用户在使用相同的搜索关键词时,搜索到数据的排序结果都是相同的。然而,在实际业务场景中,用户往往不知道大数据平台中,所想要数据表的具体名称,因此,只能使用自己所理解的中文来描述需求,由于大数据平台中的数据表通常是使用英文名称或者英文缩略词作为数据表名称,因此若使用中文进行搜索,很难在海量数据中精准找到所需数据。另一方面,使用同一个搜索关键词,对于业务不同的用户,所期望的搜索结果通常有所不同,如果大数据平台对所有用户给出一样的搜索结果,只会浪费用户搜索数据的时间。
综上可知,目前在大数据平台上搜索数据的明显缺点是:
1、用户使用中文搜索,再将中文与大数据平台上存储的数据表的中文名称、中文描述信息的匹配,但是大数据平台有上百万张数据表,数据负责人很难维护这些数据表的全部中文信息;
2、用户即使使用英文搜索,比如使用seller,虽不再是使用中文,但是大数据平台上该数据命名名称有可能不是seller,而是缩写的srl,在这种情况下,也是无法搜索到所需的结果;
3、用户需要知道所有数据表的命名名称,才能快速搜索到所需数据,否则将无法搜索到所需的结果,而这在数据为海量的大数据时代几乎是不可能做到的;
4、在上述3的情况下,用户只能通过咨询有经验的人,咨询数据开发接口人,才能快速搜索到所需数据,无形中增大了多方的时间成本;
5、使用同一个搜索关键词(key)进行搜索时,对做安全业务的用户和做售后服务的用户给出的结果相同,但是两者的需求是不同的,故而降低大数据平台的服务能力,用户体验效果较差。
发明内容
鉴于上述问题,提出了本申请实施例以便提供一种克服上述问题或者至少部分地解决上述问题的一种基于用户的个性化数据搜索方法和相应的一种基于用户的个性化数据搜索装置。
为了解决上述问题,本申请实施例公开了一种基于用户的个性化数据搜索方法,包括:
接收用户输入的搜索关键词;
从预置的语义词典中获取所述搜索关键词的关联数据;所述关联数据和所述用户分别具有对应的用户群体;
依据所述用户群体和所述关联数据为用户反馈数据。
优选地,所述语义词典通过如下方式生成:
获取一个或多个用户群体的源数据文档;
从所述源数据文档中提取出所述一个或多个用户群体对应的关联数据;
按照用户群体将所述关联数据组织为的语义词典。
优选地,所述依据用户群体和所述关联数据为用户反馈数据的步骤包括:
依据所述用户群体确定所述关联数据的权重数值;
采用所述关联数据进行搜索得到搜索结果;
按照所述权重数值将所述关联数据对应的搜索结果反馈给用户。
优选地,所述依据用户群体确定所述关联数据的权重数值的步骤包括:
判断所述用户下的所述关联数据是否已记录有对应的权重数值;
若是,则采用所述已记录的权重数值作为所述关联数据的权重数值;
若否,则采用所述用户对应的用户群体和所述关联数据的用户群体确定所述关联数据的权重数值。
优选地,所述采用用户对应的用户群体和所述关联数据的用户群体确定所述关联数据的权重数值的步骤包括:
分别判断所述关联数据的用户群体与所述用户对应的用户群体是否一致;
若是,则为所述关联数据分配第一权重数值;
若否,则为所述关联数据分配第二权重数值;
其中,所述第一权重数值大于所述第二权重数值。
优选地,所述搜索结果具有对应的用户群体,所述搜索结果对应的关联数据具有对应的用户群体,在所述按照权重数值将所述关联数据对应的搜索结果反馈给用户的步骤之后,还包括:
判断所述用户点击的搜索结果对应的用户群体是否与所述用户的用户群体一致;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于阿里巴巴集团控股有限公司,未经阿里巴巴集团控股有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201610203900.5/2.html,转载请声明来源钻瓜专利网。
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置