[发明专利]一种数据处理方法、装置和计算机存储介质在审
申请号: | 201811641976.1 | 申请日: | 2018-12-29 |
公开(公告)号: | CN109670119A | 公开(公告)日: | 2019-04-23 |
发明(设计)人: | 段伟伟 | 申请(专利权)人: | 咪咕文化科技有限公司 |
主分类号: | G06F16/9535 | 分类号: | G06F16/9535 |
代理公司: | 北京派特恩知识产权代理有限公司 11270 | 代理人: | 姚文娴;张颖玲 |
地址: | 100032 北京市西城区德*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 检索信息 目标检索 计算机存储介质 匹配内容 数据处理 检索结果 数据对应 数据提取 匹配 数据库 存储 | ||
本发明实施例公开了一种数据处理方法、装置和计算机存储介质,所述方法包括:获取输入的检索信息;识别所述检索信息,确定目标检索数据;依据所述目标检索数据,确定与所述目标检索数据相匹配的检索结果;其中,获取输入的检索信息之前,所述方法还包括:从数据库中爬取第一类数据;从所述第一类数据提取第二类数据;确定与所述第一类数据或所述第二类数据对应的匹配内容;建立并存储所述第一类数据、所述第二类数据与所述匹配内容的对应关系。
技术领域
本发明涉及计算机技术,具体涉及一种数据处理方法、装置和计算机存储介质。
背景技术
目前,用户输入不准确或不完整的词、句进行搜索时,往往得不到期望的搜索效果。例如,当用户只记住若干关键词,未能记住完整台词或准确关键词时,往往得不到期望剧目或视频的相关材料,搜索体验较差。然而,如何通过不准确或不完整的搜索信息得到期望内容,目前尚无有效解决方案。
发明内容
为解决现有存在的技术问题,本发明实施例提供了一种数据处理方法、装置和计算机存储介质。
为达到上述目的,本发明实施例的技术方案是这样实现的:
本发明实施例提供了一种数据处理方法,所述方法包括:
获取输入的检索信息;
识别所述检索信息,确定目标检索数据;
依据所述目标检索数据,确定与所述目标检索数据相匹配的检索结果。
上述方案中,可选地,所述方法还包括:
从数据库中爬取第一类数据;
从所述第一类数据提取第二类数据;
确定与所述第一类数据或所述第二类数据对应的匹配内容;
建立并存储所述第一类数据、所述第二类数据与所述匹配内容的对应关系。
上述方案中,可选地,所述识别所述检索信息,确定目标检索数据包括:
查找是否存在与所述检索信息对应的第一类数据;
当存在与所述检索信息对应的第一类数据时,将查找到的第一类数据确定为目标检索数据。
上述方案中,可选地,所述识别所述检索信息,确定目标检索数据包括:
当不存在与所述检索信息对应的第一类数据时,从所述检索信息提取至少一个第二类数据;
将所述至少一个第二类数据中的一个或多个确定为目标检索数据。
上述方案中,可选地,所述依据所述目标检索数据,确定与所述目标检索数据相匹配的检索结果之后,所述方法还包括:
满足预设条件时,以与所述预设条件对应的输出形式输出所述检索结果;
其中,所述检索结果包括与所述目标检索数据相关的源链接,以供播放、下载、分享相应内容。
上述方案中,可选地,所述从所述检索信息提取至少一个第二类数据,包括:
对所述检索信息进行分词处理并进行词性标注;
基于标注的词性从经分词处理得到的若干个词语中去除部分词语;
从剩余的词语中挑选出第二类数据。
上述方案中,可选地,所述对所述检索信息进行分词处理并进行词性标注之前,还包括:
判断所述检索信息的长度是否大于预设长度值;
当判定所述检索信息的长度大于所述预设长度值时,对所述检索信息进行分段处理,以对经分段处理后的检索信息进行分词处理。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于咪咕文化科技有限公司,未经咪咕文化科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811641976.1/2.html,转载请声明来源钻瓜专利网。