[发明专利]一种音乐资源聚合搜索的方法在审

专利信息
申请号: 202111576096.2 申请日: 2021-12-22
公开(公告)号: CN114329136A 公开(公告)日: 2022-04-12
发明(设计)人: 陈婷婷;王明璐;陈虎 申请(专利权)人: 南阳理工学院
主分类号: G06F16/951 分类号: G06F16/951;G06F16/953;G06F16/955;G06F16/958;G06F16/61;G06F16/632;G06F16/635;G06F40/279
代理公司: 威海松柏知识产权代理事务所(普通合伙) 37372 代理人: 戴立亮
地址: 473000*** 国省代码: 河南;41
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 音乐 资源 聚合 搜索 方法
【说明书】:

发明公开了种音乐资源聚合搜索的方法,包括如下步骤:建立一个音乐资源聚合网站或音乐网络聚和搜索平台,该平台或网站由用户交互界面、搜索引擎模块、音乐聚合模块和网络数据库;接收用户输入的音乐搜索关键词,通过搜索引擎模块对用户搜索关键词进行分词处理,并通过建立好的条件建立搜索范围,再通过音乐聚合模块在网络数据库中进行音乐信息爬取;本发明的有益效果是采用RSS网络爬虫设计,设计得比较简单,更加高效,可以对链接进行解析,分辨出该网页链接是否有新更新的内容,使搜索效果比较好,音乐资源的聚合比较全面和完善,还有搜索引擎模块运用了RSSearch搜索模型,提高了搜索的速度,满足了用户的需求,比较实用和完善。

技术领域

本发明涉及音乐资源聚合技术领域,具体为一种音乐资源聚合搜索的方法。

背景技术

所谓搜索引擎,就是根据用户需求与一定算法,运用特定策略从互联网检索出制定信息反馈给用户的一门检索技术;搜索引擎依托于多种技术,如网络爬虫技术、检索排序技术、网页处理技术、大数据处理技术、自然语言处理技术等,为信息检索用户提供快速、高相关性的信息服务;目前面对音乐搜索类用户,传统的搜索引擎不能满足用户的需求,搜索效果差,速度比较慢,不能更贴切的为用户进行音乐搜索,不值得广泛推广应用。

发明内容

本发明的目的在于提供一种音乐资源聚合搜索的方法,以解决上述背景技术中提出的问题。

为实现上述目的,本发明提供如下技术方案:一种音乐资源聚合搜索的方法,包括如下步骤:

1)建立一个音乐资源聚合网站或音乐网络聚和搜索平台,所述该平台或网站由用户交互界面、搜索引擎模块、音乐聚合模块和网络数据库;

2)接收用户输入的音乐搜索关键词,通过搜索引擎模块对用户搜索关键词进行分词处理,并通过建立好的条件建立搜索范围,再通过音乐聚合模块在网络数据库中进行音乐信息爬取;

3)音乐聚合模块在爬取过程中根据关键词对所述待爬取音乐信息进行筛选,并去除或者过滤掉重复的音乐信息,得到目标音乐信息,将爬取的音乐信息呈现给用户。

根据上述技术方案,步骤二中,音乐信息爬取采用RSS网络爬虫设计,音乐信息爬取的过程,获得初始网页上的URL,在抓取网页的过程中,根据一定的网页分析算法过滤与主题无关的链接,保留有用的链接并将其放入等待抓取的URL队列;然后,它将根据一定的搜索策略从队列中选择下一步要抓取的网页URL,RSS爬虫对链接进行解析,分辨出该网页链接是否有新更新的内容,并重复上述过程,直到达到系统的某一条件时停止,对数据进行保存并统一建立全文倒排索引结束。

根据上述技术方案,所有被爬虫抓取的网页将会被系统存贮,进行一定的分析、过滤,并建立索引,以便之后的查询和检索。

根据上述技术方案,音乐聚合模块从互联网中收集了大量有关人机交互的音乐RSS数据源,并通过RSS爬虫不断地收集这些源的更新信息,同时还负责对所收集的信息进行分析,通过分类器将源和条目进行分类和标识。

根据上述技术方案,所述搜索引擎模块运用了RSSearch搜索模型,RSSearch搜索模型模型包括Lucenemo模块、TPRSS模块和ItemScore模块;Lucene模块,该模块主要负责处理用户的搜索请求,将用户输入的搜索关键词进行分词,然后在已构建的索引中检索相关文档,最后得到与搜索关键词相匹配的条目列表;TPRSS模块,该模块负责对系统中RSS数据源的质量进行评价,区分不同源之间的质量高低,最后得出源的评价分值,源的分值将直接影响搜索结果中条目的质量分值高低;ItemScore模块,该模块负责对Lucene模块和TPRSS模块分别所得的条目分值进行运算,得到条目的最终排序分值,该分值是搜索排序结果的依据。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南阳理工学院,未经南阳理工学院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202111576096.2/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top