[发明专利]搜索未知信息网络时的路径规划方法及网络盗版发现系统有效
| 申请号: | 201811285660.3 | 申请日: | 2018-10-31 |
| 公开(公告)号: | CN109284436B | 公开(公告)日: | 2020-06-23 |
| 发明(设计)人: | 金哲凡 | 申请(专利权)人: | 浙江传媒学院 |
| 主分类号: | G06F16/953 | 分类号: | G06F16/953;G06F21/10 |
| 代理公司: | 杭州宇信知识产权代理事务所(普通合伙) 33231 | 代理人: | 王健 |
| 地址: | 310018 浙江省*** | 国省代码: | 浙江;33 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 搜索 未知 信息网络 路径 规划 方法 网络 盗版 发现 系统 | ||
本发明提供了一种搜索未知信息网络时的路径规划方法,应用于初始时所有结点的属性为未知的信息网络,包括如下步骤:S1、若发现某一结点具有特定属性,则将其关联值判定为正值,并将其周围结点的关联值也赋为正值,且该正值的大小随离原节点的距离而递减;S2、优先访问所述正值大的节点,若被访问节点具有所述特定属性,则重复步骤S1。本发明的方法应用于如下场合:用具有智能的系统在未知的信息网络中搜索含特定属性的结点;本发明的目的是合理规划搜索路径以提高搜索效率,同时实现网络盗版的搜索发现。
技术领域
本发明涉及信息技术领域,具体涉及一种搜索未知信息网络时的路径规划方法及使用该方法的网络盗版发现系统。
背景技术
信息网络通常由结点和结点间的连接构成。每个结点包含以下信息:一、内容信息,二、连接信息。内容信息格式上可以是文本、图像、声音、视频等,含义由特定应用而定。连接信息指向其他结点,系统利用此信息可以找到其他结点。连接信息有时被称为链接、地址等。
一般来说,“结点的属性”是指结点的内容信息的某种特性,比如文本是广告还是非广告;声音是人声、音乐还是市声;视频是否包含非法内容,等等。判断结点是否有某属性通常需要付出(人力或机器的)资源。
通常,信息网络对搜索系统而言是未知的。系统渐次、逐步地了解信息网络,此过程中,系统对一个结点的了解可有以下几种状态:
一、隐藏,系统完全不知道此结点的存在;
二、发现而未访问,系统通过相邻结点知道了此结点的存在,但还未获取其数据,自然也谈不上对其信息作任何分析;
三、了解连接而不了解内容,系统知道了此结点的连接信息,但还不知道其内容(是否满足某属性);
四、了解内容而不了解连接,系统知道了此结点的内容,但还不知道它的连接信息;
五、完全了解。
搜索系统通过逐次访问结点来发现网络,在此过程中隐藏结点的信息逐步被揭示出来。系统内部保存一批结点的信息,这些结点信息可处于上述二到五的某个状态中。系统要决定下一步走向哪里,即从状态二、三、四的众多结点中选择一个,获取其信息或进行后续的分析,如此循环。系统的目标是在未知的网络中尽量快而准确地找到特定属性的结点,上述决策的好坏将决定系统的效能。
现有技术中,上述网络发现的相关技术有以下几种:
一、深度优先搜索和广度优先搜索;二、基于内容聚类的方法;三、以 PageRanking为代表的链接分析方法。
基本的搜索路径有广度优先和深度优先两种。网络结构在图论中是一个无向图。广度优先策略从无向连通图里面的任一顶点v0出发,在访问v0点以后再依次搜索访问v0点其他还未被访问过的邻接点w1,w2,w3,…,之后再依次搜索访问w1的各个还没有被访问过的邻接点,w2各个还没有被访问过的邻接点,以此类推,即从v0点开始从近到远,按层次逐个访问跟v0点路径相通且路径长度从1开始依次是递增的顶点,最终直至图中所有顶点都被访问一次。深度优先捜索则首先访问图中任一顶点v,再从顶点v点出发开始访问跟v邻接但是还没有被访问的另一顶点w1,接着访问跟w1邻接且还没有被访问的任一顶点 w2,w3,…,重复上述过程直到不能继续往下访问时,依次逐步回退到最近访问过的顶点,这时如果还有没有被访问过邻接顶点,就从该顶点开始再次执行上述搜索的过程,直到图中所有顶点全部都被访问到为止。这两种方法都按照预定义的顺序搜索网络,对发现特定属性结点这一目标没有任何优化。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于浙江传媒学院,未经浙江传媒学院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811285660.3/2.html,转载请声明来源钻瓜专利网。





