[发明专利]物联网设备的检索方法有效
申请号: | 201710252328.6 | 申请日: | 2017-04-18 |
公开(公告)号: | CN107205016B | 公开(公告)日: | 2020-01-21 |
发明(设计)人: | 李勐;陈海明;崔莉 | 申请(专利权)人: | 中国科学院计算技术研究所 |
主分类号: | H04L29/08 | 分类号: | H04L29/08 |
代理公司: | 11280 北京泛华伟业知识产权代理有限公司 | 代理人: | 王勇 |
地址: | 100190 北*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 联网 设备 检索 方法 | ||
1.一种在服务器端进行的物联网设备的检索方法,包括以下步骤:
步骤1:爬取物联网设备信息;
步骤2:对每个所述物联网设备信息中的数据序列提取特征,对于物联网设备信息中文本描述缺失的设备,以其数据序列的特征作为输入,利用训练好的分类器获得其对应的分类标签,进而获得其分类描述,利用网络流模型来计算反映所述分类描述合理性的得分,以获得优化的分类描述,其中:
所述分类器通过训练而获得,包括:对于物联网设备信息中文本描述完整的设备,将其归类为预设的分类标签,以其数据序列的特征作为输入,以其对应的分类标签作为输出来训练分类器;
所述网络流模型通过下述方式获得:统计不同物联网应用中不同类别设备的配比信息,基于所述配比信息通过聚类算法获得所述物联网设备归属的物联网应用类型,通过对所述物联网应用类型建立网络流模型;
步骤3:基于所述分类描述生成检索索引,以用于匹配待检索的物联网设备。
2.根据权利要求1所述的方法,其中,所述分类标签采用“部署位置-采集目标-采集变量类型”的形式进行标注。
3.根据权利要求1所述的方法,其中,在对所述分类描述进行优化时采用以下公式来计算所述得分:
其中,n表示需要进行分类指派的物联网设备的数目,i为其中第i个设备,m为所有设备的类型数目,j为其中第j个类型,p(tj|si)表示设备si属于物联网设备类型tj的概率,取值为0或1,取值为1时表示设备si属于类型tj,表示在该物联网应用中,所有属于类型tj的设备的数量。
4.根据权利要求1所述的方法,其中,所述数据序列的特征包括均值、最大值、最小值、数值方差、数据序列的小波系数、跨零次数、一阶线性回归系数、取窗口后的序列均值中的至少一项。
5.根据权利要求1所述的方法,其中,步骤3包括:
基于所述物联网设备的分类描述计算词袋模型;
以所述词袋模型和所述物联网设备信息中的属性信息为输入,通过训练DMR模型获得所述物联网设备的主题向量索引;
基于所述物联网设备的分类描述获得全文索引。
6.根据权利要求5所述的方法,其中,步骤3还包括:
在接收到待检索的设备的文本内容之后,基于所述全文索引和所述主题向量索引计算反映各个设备与待检索设备的匹配程度的打分值;基于所述打分值输出检索到的物联网设备。
7.根据权利要求6所述的方法,其中,所述打分值是基于全文索引计算的打分值和基于主题向量计算的打分值的加权。
8.根据权利要求1至7中任一项所述的方法,其中,所述分类器是随机森林。
9.一种计算机可读存储介质,其上存储有计算机程序,其中,该程序被处理器执行时实现根据权利要求1至8中任一项所述的步骤。
10.一种计算机设备,包括存储器、处理器以及存储在存储器上能够在处理器上运行的计算机程序,其特征在于,所述处理器执行所述程序时实现权利要求1至8中任一项所述的步骤。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国科学院计算技术研究所,未经中国科学院计算技术研究所许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710252328.6/1.html,转载请声明来源钻瓜专利网。